Pandas:从带有字符串的列创建词云
Posted
技术标签:
【中文标题】Pandas:从带有字符串的列创建词云【英文标题】:Pandas: create word cloud from a column with strings 【发布时间】:2017-01-29 15:26:00 【问题描述】:我有一个关注 dataframe
的 string
值:
text
0 match of the day
1 euro 2016
2 wimbledon
3 euro 2016
如何从该列创建word cloud
?
【问题讨论】:
你的意思是字面意思是这样的词云:github.com/amueller/word_cloud ? 【参考方案1】:我认为你需要 tuple of tuples 和频率,所以使用 value_counts
和 list comprehension
:
tuples = tuple([tuple(x) for x in df.text.value_counts().reset_index().values])
print (tuples)
(('euro 2016', 2), ('wimbledon', 1), ('match of the day', 1))
#https://***.com/q/38247648/2901002
cloud.generate_from_frequencies(tuples)
【讨论】:
谢谢。我试图获得value_counts
,但之后我如何生成花哨的word cloud
?
很难的问题,因为我无法测试它。但我找到了解决方案并将其添加到答案中。
我找到了另一个解决方案 - 请check。以上是关于Pandas:从带有字符串的列创建词云的主要内容,如果未能解决你的问题,请参考以下文章
从 pandas DataFrame 中的列中提取 JSON 数据
如何从python中的pandas数据框中的列中提取关键字(字符串)
Pandas - 列中 groupby 之后的 Concat 字符串,忽略 NaN,忽略重复项
在 Pandas DataFrame 的列中查找并替换所有匹配但不区分大小写的字符串