使用Python统计文件中词频,并且生成词云

Posted AlanGo

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用Python统计文件中词频,并且生成词云相关的知识,希望对你有一定的参考价值。

wordcloud

1 怎样使用Python产生词云

from wordcloud import WordCloud
import matplotlib.pyplot as plt
import jieba

# Now, There is no ‘word.txt‘ under this path
path_txt = "/home/alan/Desktop/word.txt"

f = open(path_txt, ‘r‘, encoding = ‘UTF-8‘).read()

cut_text = " ".join(jieba.cut(f))

wordcloud = WordCloud(
    font_path = "/home/alan/.local/share/fonts/STKAITI.TTF",
    background_color="white",
    width=1000,
    height = 800
    ).generate(cut_text)

plt.imshow(wordcloud, interpolation = "bilinear")
plt.axis("off")
plt.show()

总体思路:

  • 导入文章
  • "jieba"分词
  • 统计词频
  • 生成并绘制词云

以上是关于使用Python统计文件中词频,并且生成词云的主要内容,如果未能解决你的问题,请参考以下文章

Python之酒店评论分词词性标注TF-IDF词频统计词云

python bs4怎么抓豆瓣评论做词频表

中文词频统计及词云制作

中文词频统计及词云制作

中文词频统计及词云制作

中文词频统计及词云制作