python为啥wordcloud 生成的词云,单词排列不够紧凑?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python为啥wordcloud 生成的词云,单词排列不够紧凑?相关的知识,希望对你有一定的参考价值。

就是稀稀拉拉的,单词之间间距很大,以下是代码和词云图片

你设置的最大号字体也就是max_font_size相对于整个图片太小了(可以设置成120试试,估计整个就会显得稠密了),而你出现的人物本身就不多,自然出来显得稀稀拉拉。追问

感谢,默认的max_front_size数值是多少?

追答

你设大点应该就可以了,默认的我也不知道。

参考技术A max_words 设小点追问

我试了,还是稀稀拉拉的,一点也不密集

python3.7生成的词云,显示成功,却没有图片?

#以下是写在idle中的代码
import jieba
import wordcloud
txt="从来就没有什么救世主,也不靠神仙皇帝\
我们要创造人类的幸福,全靠我们自己\
旧世界打个落花流水,奴隶们起来起来。"
w=wordcloud.WordCloud(width=1000,\
font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("aaaaa.png")
下面是输出结果
Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\张子成\AppData\Local\Temp\jieba.cache
Loading model cost 0.907 seconds.
Prefix dict has been built succesfully.

根据你的代码,你生成的词云图片文件名字叫做aaaaa.png,打开你存储python文件的文件夹,在那里面找到aaaaa.png这个图片文件,打开就是生成的词云了 参考技术A 1.对文本数据进行分词,也是众多NLP文本处理的第一步,对于wordcloud中的process_text()方法,主要是停词的处理.
2.计算每个词在文本中出现的频率,生成一个哈希表。词频计算相当于各种分布式计算平台的第一案例wordcount, 和各种语言的hello world 程序具有相同的地位了,呵呵。
3.根据词频的数值按比例生成一个图片的布局,类IntegralOccupancyMap是该词云的算法所在,是词云的数据可视化方式的核心。
4.将词按对应的词频在词云布局图上生成图片,核心方法是generate_from_frequencies,不论是generate()还是generate_from_text()都最终到generate_from_frequencies
5.完成词云上各词的着色,默认是随机着色
参考技术B 楼主解决了吗?如何解决的

以上是关于python为啥wordcloud 生成的词云,单词排列不够紧凑?的主要内容,如果未能解决你的问题,请参考以下文章

为啥用python画的词云很模糊

Python生成词云

python3.7生成的词云,显示成功,却没有图片?

不需要安装C++也可以用Python制作漂亮的词云

用Python和WordCloud绘制词云(内附让字体清晰的秘笈)

python生成词云图