Python政府工作报告词云

Posted 点滴记忆

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python政府工作报告词云相关的知识,希望对你有一定的参考价值。

 

 

2019政府工作报告.txt

 https://www.lanzous.com/iby44eh

 栗子1:

import wordcloud
import jieba
f=open("2019政府工作报告.txt","r",encoding="utf-8")
t=f.read()
f.close()
ls=jieba.lcut(t)
txt=" ".join(ls)
w=wordcloud.WordCloud(font_path="msyh.ttc",\\
    width=1000,height=700,background_color="white",\\
        )
w.generate(txt)
w.to_file("2019政府工作报告.png")       

结果

可以添加

max_words=15 

限制词语数量

栗子2:自定义词云背景样式,背景样式自己找一个图片

代码:

# 分词模块
import jieba
# 画图模块
import matplotlib.pyplot as plt
# 文字云模块
from wordcloud import WordCloud
# 这是一个处理图像的函数,读取背景图片
#from scipy.misc import imread  #这句出错imread不用另安装
from matplotlib.pyplot import imread
 
# 词源的文本文件
wf = \'2019政府工作报告.txt\'
# 读取文件内容
word_content = open(wf,\'r\', encoding=\'utf-8\').read().replace(\'\\n\',\'\')
# 设置背景图片
img_file = \'bj.jpg\'
# 解析背景图片
mask_img = imread(img_file)
# 进行分词
word_cut = jieba.cut(word_content)
# 把分词用空格连起来
word_cut_join = " ".join(word_cut)
# 设置词云参数
wc = WordCloud(
    #字体
    font_path="msyh.ttc",
    # 允许最大词汇量
    max_words = 2000,
    # 设置最大号字体大小
    max_font_size = 90,
    # 设置使用的背景图片,这个参数不为空时,width和height会被忽略
    mask = mask_img,
    # 设置输出的图片背景色
    background_color = \'white\'
   )
 
# 生成词云
wc.generate(word_cut_join)
wc.to_file("2019政府工作报告.png") 

结果:

以上是关于Python政府工作报告词云的主要内容,如果未能解决你的问题,请参考以下文章

Python—— 文件和数据格式化(模块6: wordcloud库的使用)(实例:自动轨迹绘制&政府工作报告词云)

实例12:政府工作报告词云

生成中英文词云

R语言文本挖掘+词云显示(jiebaR包+wordcloud2包)

R在文本挖掘与分析的妙用:分词画词云

[python] 词云:wordcloud包的安装使用原理(源码分析)中文词云生成代码重写