Python jieba 𴱟

Posted bbb001

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python jieba 𴱟相关的知识,希望对你有一定的参考价值。

原文: http://blog.gqylpy.com/gqy/356

"安装:pip install jieba

jieba 模块用于将一句或多句话按词组分割为列表.

如下示例:

import jieba


"""cut"""

s = '我就喜欢写代码'

res01 = list(jieba.cut(s))
# ['我', '就', '喜欢', '写', '代码']

# 还可以添加词组:
jieba.add_word('写代码')

res02 = list(jieba.cut(s))
# 添加词组后的结果:
# ['我', '就', '喜欢', '写代码']


"""cut_for_search"""

# cut_for_search方法适用于搜索引擎构建倒排索引的分词,力度比较细

s = '人如果没有梦想,那跟咸鱼有什么区别呢?'

# 添加词组
jieba.add_word('有什么')

res03 = list(jieba.cut_for_search(s))
# 添加词组后,使用cut_for_search的结果:
# ['人', '如果', '没有', '梦想', ',', '那', '跟', '咸鱼', '什么', '有什么', '区别', '呢', '?']

"

原文: http://blog.gqylpy.com/gqy/356

以上是关于Python jieba 𴱟的主要内容,如果未能解决你的问题,请参考以下文章

python jieba分词如何去除停用词

jieba分词(R vs. python)

python将怎么将jieba分词结果写入文本,各种编码问题啊

Python自然语言处理学习——jieba分词

Python中文分词 jieba

python有一个中文分词工具叫Jieba