火车采集器V9版工具功能之中文分词

器可以通过设置的词库,来进行中文分词,就是经常说的自动提取关键词。

1, 设置词库

如下图:

火车采集器V9版工具功能之中文分词

如上图 工具==》中文分词管理,来进行中文分词管理

火车采集器V9版工具功能之中文分词

点击上图的“分词”按钮,来使用采集器内置的词库,进行分词测试。

点击右下角的“编辑用户词库”,打开下图:

火车采集器V9版工具功能之中文分词

“分词高级设置”:是通过你选择的词性来进行分词。

“用户使用词库”:在这里添加的词,只要在采集结果里面出现,就会被提取为关键词。

“用户禁用词库”:顾名思义,这里添加的词,在采集结果里面出现,是不会做为关键词提取出来的。

设置好了点击“保存”按钮,保存。

2, 分词功能使用

火车采集器V9版工具功能之中文分词

数据处理==》添加==》高级功能==》自动分词,来使用分词功能。

提取后的关键词数量和分隔符设置:

火车采集器V9版工具功能之中文分词


原文地址:http://faq.locoy.com/q-1329.html

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
火车头

火车采集器oss上传使用方法以及注意事项

2024-1-22 22:27:16

火车头

人工智能-AI对话(HuoAiChat)的使用方法

2024-1-22 22:27:22

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索