2、之后你可能还需要一些字体,如simhei.ttf等,这些字体在网上都有,可以直接进行下载,在做词云的时候会用得到,如下图所示。
这个地方需要注意一下,由于我们的memoent.json文件中是中文字符,如果在open()函数中没有加入encoding=’utf-8’的话会导致gbk编码错误,记得将编码加上即可。
4、之后运行程序,得到keys.png图片文件,程序运行的效果如下图所示。可以看到keys.png已经在items.py目录下了。
5、双击keys.png,如下图所示。
6、不得不承认,这个词云图片内容确实丰富,不过也十分的丑。小编利用wordart(一个词云网站)将朋友圈数据进行更加美化的可视化。
7、比方说用动物的图案进行可视化,效果图如下图所示。
、编写代码,将文本进行分词,代码实现如下所示。
10、程序运行完成之后,得到的moment_outputs.txt文件,内容如下图所示,可以很清楚的看到分词情况。红色部分是程序运行的过程。
11、继续编写代码,将词频进行统计汇总,代码实现如下图所示。
12、程序运行之后,得到一个txt和Excel文件,里边是关于词频统计的信息,如下图所示。红色部分是程序运行的结果,并没有报错。
13、将这些关键字导入到wordart中进行可视化,如下图所示。
14、设置一下图案、字体、排版、颜色等等,就可以生成绚丽的词云图了,下图是汪星人词云图。
15、下图是小云朵词云图,可以给视觉带来一场饕餮盛宴。
小伙伴们,你们有没有觉得很神奇呢?喜欢的话欢迎收藏和转载噢~~
欢迎关注我的博客哦:https://home.cnblogs.com/u/sm123456/