中文分词之结巴分词~~~附使用场景+demo(net)
Posted 逸鹏说道
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了中文分词之结巴分词~~~附使用场景+demo(net)相关的知识,希望对你有一定的参考价值。
常用技能(更新ing):
技能总纲(更新ing):
在线演示:
完整demo:
逆天修改版:
先说下注意点,结巴分词他没有对分词进行一次去重,我们得自己干这件事;字典得自行配置或者设置成输出到bin目录
应用场景举例(搜索那块大家都知道,说点其他的)
——————————————————————————————————————————————————
言归正传:看一组民间统计数据:(非Net版,指的是官方版)
net版的IKanalyzer和盘古分词好多年没更新了,所以这次选择了结巴分词(这个名字也很符合分词的意境~~结巴说话,是不是也是一种分词的方式呢?)
下面简单演示一下:
1.先引入包:
2.字典设置:
3.简单封装的帮助类:
using
System.Linq;
以上是关于中文分词之结巴分词~~~附使用场景+demo(net)的主要内容,如果未能解决你的问题,请参考以下文章
北大pkuseg-python中文分词工具包准确度高于THULAC和jieba结巴(附PDF公号发“pkuseg中文分词”下载)