WordCloud
Posted garden6zg
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了WordCloud相关的知识,希望对你有一定的参考价值。
1. wordcloud概述
wordcloud是优秀的词云展示第三方
词云以词语为基本单位,更加直观和艺术地展示文本
2.安装wordcloud
在编写程序之前需要下载第三方库:
jieba
wordcloud
scipy
python3.0是:pip3 install module_name
python2.7是:pip install module_name
3.wordcloud库的使用
- wordcloud库把词云当作一个WordCloud对象
- wordcloud.WordCloud()代表一个文本对应的词云
- 可以根据文本中词语出现的频率等参数绘制词云
- 词云的绘制形状、尺寸和颜色都可以设定
4. wordcloud.WordCloud()中参数解释
参数 | 描述 |
---|---|
width | 指定词云对象生成图片的宽度,默认400像素>>>w=wordcloud.WordCloud(width=600) |
height | 指定词云对象生成图片的高度,默认200像素>>>w=wordcloud.WordCloud(height=400) |
min_font_size | 指定词云中字体的最小字号,默认4号>>>w=wordcloud.WordCloud(min_font_size=10) |
max_font_size | 指定词云中字体的最大字号,根据高度自动调节>>>w=wordcloud.WordCloud(max_font_size=20) |
font_step | 指定词云中字体字号的步进间隔,默认为1>>>w=wordcloud.WordCloud(font_step=2) |
font_path | 指定字体文件的路径,默认None>>>w=wordcloud.WordCloud(font_path="msyh.ttc") |
max_words | 指定词云显示的最大单词数量,默认200>>>w=wordcloud.WordCloud(max_words=20) |
stop_words | 指定词云的排除词列表,即不显示的单词列表>>>w=wordcloud.WordCloud(stop_words={"Python"}) |
mask | 指定词云形状,默认为长方形,需要引用imread()函数>>>from scipy.misc import imread>>>mk=imread("pic.png")>>>w=wordcloud.WordCloud(mask=mk) |
background_color | 指定词云图片的背景颜色,默认为黑色>>>w=wordcloud.WordCloud(background_color="white") |
5.程序模版
import jieba
import wordcloud
file1 = open("country.txt", "r") #打开文本
t = file1.read() #读取全部内容
file1.close() #关闭文件
ls = jieba.lcut(t) #将读取内容转化成列表形式
txt = " ".join(ls) #用空格连接内容,必须是空格
w = wordcloud.WordCloud(font_path="ukai.ttc", width=1000, height=700, background_color="white")
w.generate(txt) #向wordcloud对象中添加txt文本
w.to_file("map.png") #将词云输出成图像文件
5.图片实例
- 在自定义图片输出格式之后,比如输出中国地图样式的图片,只需在上述代码中添加如下几行代码即可:
from scipy.misc import imread
mask=imread("chinamap.jpg") #自定义要输出的词云形状,注意添加的图片背景颜色必须与要输出的图片一致。
在wordcloud.WordCloud()中添加参数mask=mask
以上是关于WordCloud的主要内容,如果未能解决你的问题,请参考以下文章