[python练手]使用WordCloud模块将qq聊天记录生成炫酷的关键词云

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[python练手]使用WordCloud模块将qq聊天记录生成炫酷的关键词云相关的知识,希望对你有一定的参考价值。

参考技术A 这个项目的github地址。 https://github.com/susususuhanmo/QQChatLogWordCloud
最近准备开始学习python,写一个综合一点的小demo练练手~

读取文件

编写清洗函数,清洗聊天数据。主要是需要清洗掉一些无用的关键词:

分词,分词结果如果出现一些特有的词语截了一半或者截多了几个字符的情况,可以手动添加分词词库。

根据关键词数据,建立pandas的DataFrame,通过停词词库过滤掉一些中文中不适合做关键词的词语,进行关键词数统计并根据次数排序。

词云属性解释

调整成120之后就好看很多,有很明显的差别。

设置图片为可爱的莫古力

根据这个莫古力的颜色分布,生成的词云如下,我这个不是特别好看,大家可以选择轮廓明显一点的图片来生成。

相比默认的模式,

关于更详细的词云配置可以看这篇文章,这个作者对wordcloud的配置讲解的十分详细。
https://blog.csdn.net/heyuexianzi/article/details/76851377

在你想导出的人或群处右键,点导出消息记录,

然后选择txt格式

以上是关于[python练手]使用WordCloud模块将qq聊天记录生成炫酷的关键词云的主要内容,如果未能解决你的问题,请参考以下文章

Python—— 文件和数据格式化(模块6: wordcloud库的使用)(实例:自动轨迹绘制&政府工作报告词云)

7.5 Python 模块6-wordcloud库的使用

如何安装wordcloud python whl

Python实现Wordcloud生成词云图的示例

Python 词云 中/英小白简单入门教程

python做词云 (WordCloud)