结巴分词 0.32 发布,Python 中文分词组件
Posted PythonerCN
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了结巴分词 0.32 发布,Python 中文分词组件相关的知识,希望对你有一定的参考价值。
结巴分词:做最好的Python中文分词。
此次release包含以下更新:
1. 新增分词控制选项:可以关闭新词发现功能;详见:https://github.com/fxsjy/jieba/blob/master/test/test_no_hmm.py#L8
2. 修复词性标注子模块的Bug;详见: https://github.com/fxsjy/jieba/issues/111 https://github.com/fxsjy/jieba/issues/132
3. ChineseAnalyzer提供了更好的英文支持(感谢@jannson),例如单词Stemming; 详见:https://github.com/fxsjy/jieba/pull/106
以上是关于结巴分词 0.32 发布,Python 中文分词组件的主要内容,如果未能解决你的问题,请参考以下文章