jieba库分词词频统计

Posted 就是你吧

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了jieba库分词词频统计相关的知识,希望对你有一定的参考价值。

代码已发至github上的python文件

词频统计结果如下(词频为1的词组数量已省略):

{\'是\': 5, \'风格\': 4, \'擅长\': 4, \'的\': 4, \'兴趣\': 4, \'宣言\': 4, \'有\': 3, \'python\': 3, \'代码\': 2, \'员\': 2, \'helloworld\': 2, \'哲学\': 2, \'当\': 2, \'对\': 2, \'很\': 2, \'matlab\': 2, \'平凡\': 2}

用词特点:

柱形图和饼图的创建通过代码实现
图画中只显示频数2以上的词频
重复的词频较少,说明我们团队中,每个人都有擅长的地方,彼此间可以互补
用词方面直接明了,富有幽默感,各自的宣言也很有创意

柱形图如下:

 

饼图:

 

 

以上是关于jieba库分词词频统计的主要内容,如果未能解决你的问题,请参考以下文章

如何用python和jieba分词,统计词频?

使用jieba库与wordcloud库第三方库进行词频统计

用jieba库统计文本词频及云词图的生成

python词频统计

python词频统计

中文词频统计