使用jieba库与wordcloud库第三方库进行词频统计
Posted loverboy88
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用jieba库与wordcloud库第三方库进行词频统计相关的知识,希望对你有一定的参考价值。
一、jieba库与wordcloud库的使用
1.jieba库与wordcloud库的介绍
jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加自定义中文单词的功能。
wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本。
2.安装jieba库与wordcloud库
在运行里输入 pip install wordcloud和pip install jieba,等待安装完成。
二、jieba函数介绍
三、调用库函数
from wordcloud import WordCloud with open("斗破苍穹.txt" ,encoding="utf-8")as file: #1.读取文本内容 text=file.read() #2.设置词云的背景颜色、宽高、字数 wordcloud=WordCloud(font_path="C:/Windows/Fonts/simfang.ttf", background_color="black",width=600, height=300,max_words=50).generate(text) #3.生成图片 image=wordcloud.to_image() #4.显示图片 image.show()
以上是关于使用jieba库与wordcloud库第三方库进行词频统计的主要内容,如果未能解决你的问题,请参考以下文章
知识学习用Python实现中文word cloud(wordcloud,Jieba)的全过程