Python 绘制词云

Posted ddiamondd

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 绘制词云相关的知识,希望对你有一定的参考价值。

文本内容:data(包含很多条文本)

1、分词:

import jieba
data_cut = data.apply(jieba.lcut)

2、去除停用词:

stoplist.txt:链接:https://pan.baidu.com/s/1lN1J8aUFOwqXpYMzuqVA7w  提取码:nk7z 

with open(rD:\数据文件\stoplist.txt, encoding=utf-8) as f:
    txt = f.read()
stop = txt.split()
stop = stop + [ ]   #把空格加进去
data_after = data_cut.apply(
lambda x : [i for i in x if i not in stop]
)

3、

from tkinter import _flatten
tmp = pd.Series(_flatten(list(data_after)))   #把二维变成一维
num = tmp.value_counts()

4、绘制

from wordcloud import WordCloud
import matplotlib.pyplot as plt  

pic = plt.imread(rD:\数据文件\aixin.jpg)
wc = WordCloud(
    background_color=white,
    mask=pic,
    font_path=rC:/Windows/Fonts/simsun.ttc)
wc2 = wc.fit_words(num)
plt.imshow(wc2)
plt.axis(off)
plt.show()

 

以上是关于Python 绘制词云的主要内容,如果未能解决你的问题,请参考以下文章

Python 绘制词云

为啥用python画的词云很模糊

python爬虫(18)爬取微信公众号内容——绘制词云

三分钟学会 Python 中文分词与词云绘制——以豆瓣《至爱梵高》影评为例丨数析学院

Python—— 文件和数据格式化(模块6: wordcloud库的使用)(实例:自动轨迹绘制&政府工作报告词云)

Python数据挖掘-词云