Python 绘制词云
Posted ddiamondd
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 绘制词云相关的知识,希望对你有一定的参考价值。
文本内容:data(包含很多条文本)
1、分词:
import jieba data_cut = data.apply(jieba.lcut)
2、去除停用词:
stoplist.txt:链接:https://pan.baidu.com/s/1lN1J8aUFOwqXpYMzuqVA7w 提取码:nk7z
with open(r‘D:\数据文件\stoplist.txt‘, encoding=‘utf-8‘) as f: txt = f.read() stop = txt.split() stop = stop + [‘ ‘] #把空格加进去 data_after = data_cut.apply( lambda x : [i for i in x if i not in stop] )
3、
from tkinter import _flatten tmp = pd.Series(_flatten(list(data_after))) #把二维变成一维 num = tmp.value_counts()
4、绘制
from wordcloud import WordCloud import matplotlib.pyplot as plt pic = plt.imread(r‘D:\数据文件\aixin.jpg‘) wc = WordCloud( background_color=‘white‘, mask=pic, font_path=r‘C:/Windows/Fonts/simsun.ttc‘) wc2 = wc.fit_words(num) plt.imshow(wc2) plt.axis(‘off‘) plt.show()
以上是关于Python 绘制词云的主要内容,如果未能解决你的问题,请参考以下文章
三分钟学会 Python 中文分词与词云绘制——以豆瓣《至爱梵高》影评为例丨数析学院