列表中每个唯一元素的计数[重复]

Posted

技术标签:

【中文标题】列表中每个唯一元素的计数[重复]【英文标题】:Count of each unique element in a list [duplicate] 【发布时间】:2017-11-09 04:14:39 【问题描述】:

假设我有一个国家/地区列表

l = ['India', 'China', 'China', 'Japan', 'USA', 'India', 'USA']  

然后我有一个独特国家/地区的列表

ul = ['India', 'China', 'Japan', 'USA']

我想按升序计算列表中每个唯一国家/地区的数量。所以输出应该如下:

Japan 1
China 2
India 2
USA   2

【问题讨论】:

【参考方案1】:

如果您不想使用Counter,您可以使用字典来计算自己(您已经知道独特的元素,因为您有ul):

l = ['India', 'China', 'China', 'Japan', 'USA', 'India', 'USA'] 
ul = ['India', 'China', 'Japan', 'USA']

cnts = dict.fromkeys(ul, 0)  # initialize with 0

# count them
for item in l:
    cnts[item] += 1

# print them in ascending order
for name, cnt in sorted(cnts.items(), key=lambda x: x[1]):  # sort by the count in ascending order
    print(name, cnt)   
    # or in case you need the correct formatting (right padding for the name):
    # print(':<5'.format(name), cnt)  

哪个打印:

Japan 1
China 2
India 2
USA   2

【讨论】:

【参考方案2】:

如果您想根据ul 列表进行排序,您可以使用列表推导式:

l = ['India', 'China', 'China', 'Japan', 'USA', 'India', 'USA']
ul = ['India', 'China', 'Japan', 'USA']
result = sorted([(x, l.count(x)) for x in ul], key=lambda y: y[1])
for elem in result:
    print ' '.format(elem[0], elem[1])

输出:

Japan 1
India 2
China 2
USA 2

如果你想在按count排序后按字母排序,可以将result改成如下:

result = sorted(sorted([(x, l.count(x)) for x in ul]), key=lambda y: y[1])

输出:

Japan 1
China 2
India 2
USA 2

【讨论】:

使用count 的列表理解比Counter 方法慢得多 - 与订单 n 相比,订单 n^2 只是为了计数。请参阅此答案进行分析:***.com/a/23909767/2337736 这种方法只是为了防止他有一个他想要搜索的预定义项目列表(如示例中所述),而不是所有项目 即便如此,我认为您可能想要分析类似 ul_set = frozenset(ul); counts = Counter(country for country in countries if country in ul_set) 的内容 - 您确实希望避免在同一个列表中多次运行 count。我的意思是,这对于短名单来说很好,但您不妨使用更快的工具。【参考方案3】:

您可以使用集合中的计数器:

from collections import Counter

l = ["India", "China", "China", "Japan", "USA", "India", "USA"]

new_vals = Counter(l).most_common()
new_vals = new_vals[::-1] #this sorts the list in ascending order

for a, b in new_vals:
    print a, b

【讨论】:

Counter(l).items() 的输出是否保证返回一个按计数排序的列表?我认为您需要使用most_common() 同意。 Counter 文档给出了 n 最不常见的配方:c.most_common()[:-n-1:-1] - 如果 n 等于项目总数,则简化为通常的 [::-1] @Ajax1234 如果我在我的数据上运行它并收到错误怎么办 - TypeError: unhashable type: 'dict' 您是否使用了本例中硬编码的数据,即“l”? 该异常表明您的列表至少包含一个字典 - 计数器要求您计数的元素是可散列的,而字典不是。

以上是关于列表中每个唯一元素的计数[重复]的主要内容,如果未能解决你的问题,请参考以下文章

使用集合的Python唯一列表[重复]

如何查找列表中所有唯一元素的所有索引[重复]

从python列表中获取元素的唯一组合[重复]

计算嵌套列表中所有元素的计数

django中列表列表的排名和计数元素

C - 计数元素(绑定检查) - 数组 [重复]