jieba库中使用文本时怎么搜索
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了jieba库中使用文本时怎么搜索相关的知识,希望对你有一定的参考价值。
ⅠIDLE中jieba库的安装:Windows 下使用命令安装:在联网状态下,在命令行下输入 pip
install jieba 进行安装,安装完成后会提示安装成功。具体过程如图:
① Win + r 打开运行框并输入cmd打开指令框:
②在指令框输入“pip install jieba”并按下回车等待下载:
③ 当出现“Successfully instll”,则表示安装成功!
Ⅱ Pycharm中jieba库的安装:
打开 settings,搜索 Project Interpreter,在右边的窗口选择 + 号,点击后在搜索框搜索 jieba,点击安装即可。具体过程如图:
① 点击左上角Files中的Settings:
② [endif]找到“Project”中的“python interpreter”,并点击其中的“+”:
③在搜索栏中搜索“jieba”,并点击左下角Install Package:
④ 当出现“Successfully instll
jieba”,则表示jieba库安装成功 参考技术A 打开 settings,搜索 Project Interpreter,在右边的窗口选择 + 号,点击后在搜索框搜索 jieba,点击安装即可。具体过程如图:
① 点击左上角Files中的Settings:
90d06378ceea4b0a33e08607e65d9c5b.png
② [endif]找到“Project”中的“python interpreter”,并点击其中的“+”:
29575b1cbf595fea296d7bf9ce519840.png
③在搜索栏中搜索“jieba”,并点击左下角Install Package:
9fcf461a89e097bfd701152297d9633b.png
④ 当出现“Successfully instll
jieba”,则表示jieba库安装成功! 参考技术B jieba分词的三种模式
精确模式、全模式、搜索引擎模式
① jieba.cut(s) 精确模式:把文本精确的切分开,不存在冗余单词:
bff7a62cec36f6b9564f6150bae3784a.png
e4024eb2bba1b8318a3e8489502d8068.png
② jieba.lcut(s,cut_all=True) 全模式:把文本中所有可能的词语都扫描出来,有冗余:
5f230e1f9a92495abc18eaaf21891980.png
52e4a4c5deb1951c602db0566d13a7e2.png
③jieba.lcut_for_search(s) 搜索引擎模式:在精确模式基础上,对长词再次切分:
优秀的中文分词jieba库
jieba库的简介
jieba是优秀的中文分词库,中文文本需要通过分词来获的单个词语。jieba库提供了三种分词模式:精确模式,全模式,搜索引擎模式。精确模式是将文本精确割分,不存在冗余。全模式是将文本中所有可能单词都扫描出来,存在冗余。搜索引擎模式是将经过精确模式分割下的长词在进行分割。
常见jieba库的函数
以上是关于jieba库中使用文本时怎么搜索的主要内容,如果未能解决你的问题,请参考以下文章