借鉴别人的一个小例子,快速生成词云的代码:
1 from wordcloud import WordCloud 2 3 f = open(u‘txt/AliceEN.txt‘,‘r‘).read() 4 wordcloud = WordCloud(background_color="white",width=1000, height=860, margin=2).generate(f) 5 6 # width,height,margin可以设置图片属性 7 8 # generate 可以对全部文本进行自动分词,但是他对中文支持不好,对中文的分词处理请看我的下一篇文章 9 #wordcloud = WordCloud(font_path = r‘D:\Fonts\simkai.ttf‘).generate(f) 10 # 你可以通过font_path参数来设置字体集 11 12 #background_color参数为设置背景颜色,默认颜色为黑色 13 14 import matplotlib.pyplot as plt 15 plt.imshow(wordcloud) 16 plt.axis("off") 17 plt.show() 18 19 wordcloud.to_file(‘test.png‘) 20 # 保存图片,但是在第三模块的例子中 图片大小将会按照 mask 保存
解释一下WordCloud各参数的含义:
font_path: string #"仿宋.ttf"
width,height 画布宽高
max_words: 显示词的最大个数 default = 200
mask : 图片形状,接受一个ndarray参数(三维数组)
backgroud_color: 背景颜色
stopwords :屏蔽的词 (from wordcloud import STOPWORDS)
关于集合的操作:add,remove,&,|,- 增,删,交集,并集,差集