Python政府工作报告词云
Posted 点滴记忆
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python政府工作报告词云相关的知识,希望对你有一定的参考价值。
2019政府工作报告.txt
https://www.lanzous.com/iby44eh
栗子1:
import wordcloud import jieba f=open("2019政府工作报告.txt","r",encoding="utf-8") t=f.read() f.close() ls=jieba.lcut(t) txt=" ".join(ls) w=wordcloud.WordCloud(font_path="msyh.ttc",\\ width=1000,height=700,background_color="white",\\ ) w.generate(txt) w.to_file("2019政府工作报告.png")
结果
可以添加
max_words=15
限制词语数量
栗子2:自定义词云背景样式,背景样式自己找一个图片
代码:
# 分词模块 import jieba # 画图模块 import matplotlib.pyplot as plt # 文字云模块 from wordcloud import WordCloud # 这是一个处理图像的函数,读取背景图片 #from scipy.misc import imread #这句出错imread不用另安装 from matplotlib.pyplot import imread # 词源的文本文件 wf = \'2019政府工作报告.txt\' # 读取文件内容 word_content = open(wf,\'r\', encoding=\'utf-8\').read().replace(\'\\n\',\'\') # 设置背景图片 img_file = \'bj.jpg\' # 解析背景图片 mask_img = imread(img_file) # 进行分词 word_cut = jieba.cut(word_content) # 把分词用空格连起来 word_cut_join = " ".join(word_cut) # 设置词云参数 wc = WordCloud( #字体 font_path="msyh.ttc", # 允许最大词汇量 max_words = 2000, # 设置最大号字体大小 max_font_size = 90, # 设置使用的背景图片,这个参数不为空时,width和height会被忽略 mask = mask_img, # 设置输出的图片背景色 background_color = \'white\' ) # 生成词云 wc.generate(word_cut_join) wc.to_file("2019政府工作报告.png")
结果:
以上是关于Python政府工作报告词云的主要内容,如果未能解决你的问题,请参考以下文章
Python—— 文件和数据格式化(模块6: wordcloud库的使用)(实例:自动轨迹绘制&政府工作报告词云)