jieba库中使用文本时怎么搜索

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了jieba库中使用文本时怎么搜索相关的知识,希望对你有一定的参考价值。

ⅠIDLE中jieba库的安装:

Windows 下使用命令安装:在联网状态下,在命令行下输入 pip

install jieba 进行安装,安装完成后会提示安装成功。具体过程如图:

① Win + r 打开运行框并输入cmd打开指令框:

②在指令框输入“pip install jieba”并按下回车等待下载:

③ 当出现“Successfully instll”,则表示安装成功!

Ⅱ Pycharm中jieba库的安装:
打开 settings,搜索 Project Interpreter,在右边的窗口选择 + 号,点击后在搜索框搜索 jieba,点击安装即可。具体过程如图:

① 点击左上角Files中的Settings:

② [endif]找到“Project”中的“python interpreter”,并点击其中的“+”:

③在搜索栏中搜索“jieba”,并点击左下角Install Package:

④ 当出现“Successfully instll

jieba”,则表示jieba库安装成功
参考技术A 打开 settings,搜索 Project Interpreter,在右边的窗口选择 + 号,点击后在搜索框搜索 jieba,点击安装即可。具体过程如图:

① 点击左上角Files中的Settings:

90d06378ceea4b0a33e08607e65d9c5b.png

② [endif]找到“Project”中的“python interpreter”,并点击其中的“+”:

29575b1cbf595fea296d7bf9ce519840.png

③在搜索栏中搜索“jieba”,并点击左下角Install Package:

9fcf461a89e097bfd701152297d9633b.png

④ 当出现“Successfully instll

jieba”,则表示jieba库安装成功!
参考技术B jieba分词的三种模式

精确模式、全模式、搜索引擎模式

① jieba.cut(s) 精确模式:把文本精确的切分开,不存在冗余单词:

bff7a62cec36f6b9564f6150bae3784a.png

e4024eb2bba1b8318a3e8489502d8068.png

② jieba.lcut(s,cut_all=True) 全模式:把文本中所有可能的词语都扫描出来,有冗余:

5f230e1f9a92495abc18eaaf21891980.png

52e4a4c5deb1951c602db0566d13a7e2.png

③jieba.lcut_for_search(s) 搜索引擎模式:在精确模式基础上,对长词再次切分:

优秀的中文分词jieba库

jieba库的简介

jieba是优秀的中文分词库,中文文本需要通过分词来获的单个词语。jieba库提供了三种分词模式:精确模式,全模式,搜索引擎模式。精确模式是将文本精确割分,不存在冗余。全模式是将文本中所有可能单词都扫描出来,存在冗余。搜索引擎模式是将经过精确模式分割下的长词在进行分割。
常见jieba库的函数
技术分享图片

技术分享图片



以上是关于jieba库中使用文本时怎么搜索的主要内容,如果未能解决你的问题,请参考以下文章

优秀的中文分词jieba库

jieba库

模块5:jieba库的使用

jieba库的使用

HSQLDB 文本搜索性能

jieba库基本使用