结巴分词 0.32 发布,Python 中文分词组件

Posted PythonerCN

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了结巴分词 0.32 发布,Python 中文分词组件相关的知识,希望对你有一定的参考价值。

结巴分词:做最好的Python中文分词。

此次release包含以下更新:

1. 新增分词控制选项:可以关闭新词发现功能;详见:https://github.com/fxsjy/jieba/blob/master/test/test_no_hmm.py#L8

2. 修复词性标注子模块的Bug;详见: https://github.com/fxsjy/jieba/issues/111 https://github.com/fxsjy/jieba/issues/132

3. ChineseAnalyzer提供了更好的英文支持(感谢@jannson),例如单词Stemming; 详见:https://github.com/fxsjy/jieba/pull/106


以上是关于结巴分词 0.32 发布,Python 中文分词组件的主要内容,如果未能解决你的问题,请参考以下文章

结巴中文分词使用学习(python)

中文分词——Python结巴分词器

“结巴”中文分词:做最好的 Python 中文分词组件

中文分词之结巴分词~~~附使用场景+demo(net)

如何利用Python对中文进行分词处理

Python第三方库jieba(结巴-中文分词)入门与进阶(官方文档)