python(wordcloud)实现中文词云
Posted tridents
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python(wordcloud)实现中文词云相关的知识,希望对你有一定的参考价值。
# 这是一个处理图像的函数
from scipy.misc import imread
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
import matplotlib.pylab as plt
# 解析图片
back_color = imread("./veer-141001498.png")
# 设置字体路径
font = "C:WindowsFontsSTXINGKA.TTF"
wc = WordCloud(background_color="white", # 背景颜色
max_words=500, # 最大词数
mask=back_color, # 掩膜,产生词云背景的区域,以该参数值作图绘制词云,这个参数不为空时,width,height会被忽略
max_font_size=80, # 显示字体的最大值
stopwords=STOPWORDS.add("差评"), # 使用内置的屏蔽词,再添加一个
font_path=font, # 解决显示口字型乱码问题,可进入C:/Windows/Fonts/目录更换字体
random_state=42, # 为每一词返回一个PIL颜色
prefer_horizontal=10) # 调整词云中字体水平和垂直的多少
# 打开词源的文本文件
text = open("./comments.txt","r",encoding="utf-8").read()
# 生成词云
wc.generate(text)
# 从背景图片生成颜色值
image_colors = ImageColorGenerator(back_color)
# 显示图片
plt.imshow(wc)
# 关闭坐标轴
plt.axis("off")
# 绘制词云
plt.figure()
plt.imshow(wc.recolor(color_func=image_colors))
plt.axis("off")
# 保存图片
wc.to_file("text2.png")
# 以下为效果图
以上是关于python(wordcloud)实现中文词云的主要内容,如果未能解决你的问题,请参考以下文章
[python] 词云:wordcloud包的安装使用原理(源码分析)中文词云生成代码重写