pyecharts应用1 词云
Posted 刘文巾
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pyecharts应用1 词云相关的知识,希望对你有一定的参考价值。
1 导入库
from pyecharts import options as opts
from pyecharts.charts import WordCloud
2 最基础的默认格式词云
wordfreq_list = [('诸葛亮', '1068'), ('刘备', '1025'), ('曹操', '953'),
('关羽', '638'), ('张飞', '365'), ('赵云', '333'),
('吕布', '302'), ('孙权', '273'), ('周瑜', '265'),
('司马懿', '241'), ('魏延', '212'), ('袁绍', '199'),
('马超', '194'), ('姜维', '179'), ('黄忠', '168'),
('马岱', '127'), ('庞德', '122'), ('刘表', '119'),
('张辽', '119'), ('董卓', '114'), ('徐晃', '113'),
('孙策', '108'), ('鲁肃', '107'), ('邓艾', '106'),
('许褚', '92'), ('司马昭', '89'), ('夏侯渊', '88'),
('王平', '88'), ('曹仁', '86'), ('刘璋', '83'),
('吕蒙', '83'), ('张苞', '81'), ('袁术', '78'),
('孟获', '78'), ('曹洪', '77'), ('陆逊', '74'),
('孟达', '73')]
# 用于生成词云的列表,列表元素为元组,元组有固定格式
# 元组的第一个元素是“词”
# 元组的第二个元素是“词频”,是字符串形式的数值
cloud = WordCloud()
# 初始化词云对象
cloud.add('', wordfreq_list)
# 向词云中添加内容,
#第一个参数可以设为空,
#第二个参数为元组列表(词和词频)
out_filename = 'wordcloud_example.html'
cloud.render(out_filename)、
# 生成词云图文件
# render会生成HTML文件。默认是当前目录render.html,也可以指定文件名参数
词云效果图
3 指定轮廓的词云
假设我们有一张蝴蝶的地图(词云背景图-蝴蝶.jpg),我们希望词云的轮廓是这张地图。
wordfreq_list 和之前是一样的
cloud = WordCloud()
# 初始化词云对象
# 设置词云图
cloud.add('',
wordfreq_list,
#元组列表,词和词频
shape='diamond',
# 轮廓形状:'circle','cardioid','diamond',
# 'triangle-forward','triangle','pentagon','star'
mask_image='词云背景图-蝴蝶.jpg',
# 轮廓图,第一次显示可能有问题,刷新即可
is_draw_out_of_bound=False,
#是否允许词云超出画布边界
word_size_range=[15, 50],
#字体大小范围
textstyle_opts=opts.TextStyleOpts(font_family="华文行楷"),
#字体:例如,微软雅黑,宋体,华文行楷,Arial
)
# 设置标题
cloud.set_global_opts(title_opts=opts.TitleOpts(title="三国人物词云"))
之后的render什么的和之前也是一样的
词云效果图
以上是关于pyecharts应用1 词云的主要内容,如果未能解决你的问题,请参考以下文章
Python爬虫实战,爬取A股公司数据,简单分析A股公司并生成词云