二维列表中的Python计数元素频率[重复]
Posted
技术标签:
【中文标题】二维列表中的Python计数元素频率[重复]【英文标题】:Python-Counting element frequency in a 2D list [duplicate] 【发布时间】:2017-03-01 14:32:30 【问题描述】:我想知道是否有一种方法可以计算 2D python 列表中的元素频率。 对于一维列表,我们可以使用
list.count(word)
但是如果我有一个列表呢:
a = [ ['hello', 'friends', 'its', 'mrpycharm'],
['mrpycharm', 'it', 'is'],
['its', 'mrpycharm'] ]
我能找到这个二维列表中每个单词的频率吗?
【问题讨论】:
【参考方案1】:假设我明白你想要什么,
>>> collections.Counter([x for sublist in a for x in sublist])
Counter('mrpycharm': 3, 'its': 2, 'friends': 1, 'is': 1, 'it': 1, 'hello': 1)
或者,
>>> c = collections.Counter()
>>> for sublist in a:
... c.update(sublist)
...
>>> c
Counter('mrpycharm': 3, 'its': 2, 'friends': 1, 'is': 1, 'it': 1, 'hello': 1)
【讨论】:
你知道使用生成器表达式而不是列表推导式是否会导致加速吗?Counter(x for sublist in a for x in sublist)
【参考方案2】:
您可以使用defaultdict
:
from collections import defaultdict
d = defaultdict(int)
for sublist in a:
for word in sublist:
d[word] += 1
【讨论】:
@juanpa.arrivillaga 为什么收藏错了? 看sberry的回答 但这似乎也可以正常工作 @juanpa.arrivillaga:但这并不意味着它是错误的集合。 不是错误的收藏,只是不同的选择。在 2.7 中引入它之前,这正是我会做的。对于它的价值,对于我的机器(和 CPython2.7)上的这种大小的数据,这个解决方案比使用 Counter 快 50% 以上。【参考方案3】:您已经知道list.count()
。只需获取每个sublist
和sum
中的字数。例如:
>>> my_word = 'its'
>>> sum(sublist.count(my_word) for sublist in a)
2
如果您想要list
中出现的每个单词的频率,这里有很多很好的答案。或者,如果您想在没有任何import
的情况下执行此操作(使用普通的dict
),您可以这样做:
my_dict =
for sublist in a:
for item in sublist:
if item not in my_dict:
my_dict[item] = 0
my_dict[item] += 1
# Value of my_dict:
'friends': 1, 'is': 1, 'it': 1, 'its': 2, 'mrpycharm': 3, 'hello': 1
【讨论】:
以上是关于二维列表中的Python计数元素频率[重复]的主要内容,如果未能解决你的问题,请参考以下文章
在Python中检查二维数组中的所有元素是不是等于1 [重复]