Pandas:从带有字符串的列创建词云

Posted

技术标签:

【中文标题】Pandas:从带有字符串的列创建词云【英文标题】:Pandas: create word cloud from a column with strings 【发布时间】:2017-01-29 15:26:00 【问题描述】:

我有一个关注 dataframestring 值:

  text
0 match of the day
1 euro 2016
2 wimbledon
3 euro 2016

如何从该列创建word cloud

【问题讨论】:

你的意思是字面意思是这样的词云:github.com/amueller/word_cloud ? 【参考方案1】:

我认为你需要 tuple of tuples 和频率,所以使用 value_countslist comprehension

tuples = tuple([tuple(x) for x in df.text.value_counts().reset_index().values])
print (tuples)
(('euro 2016', 2), ('wimbledon', 1), ('match of the day', 1))

#https://***.com/q/38247648/2901002
cloud.generate_from_frequencies(tuples)

【讨论】:

谢谢。我试图获得value_counts,但之后我如何生成花哨的word cloud 很难的问题,因为我无法测试它。但我找到了解决方案并将其添加到答案中。 我找到了另一个解决方案 - 请check。

以上是关于Pandas:从带有字符串的列创建词云的主要内容,如果未能解决你的问题,请参考以下文章

从 pandas DataFrame 中的列中提取 JSON 数据

如何从python中的pandas数据框中的列中提取关键字(字符串)

Pandas - 列中 groupby 之后的 Concat 字符串,忽略 NaN,忽略重复项

在 Pandas DataFrame 的列中查找并替换所有匹配但不区分大小写的字符串

将包含字符串和 NAN 的列转换为 Pandas 中的整数列表

Python Pandas Regex:在列中搜索带有通配符的字符串并返回匹配项[重复]