如何根据对象的属性对对象列表进行排序?

Posted

技术标签:

【中文标题】如何根据对象的属性对对象列表进行排序?【英文标题】:How to sort a list of objects based on an attribute of the objects? 【发布时间】:2022-01-05 13:44:46 【问题描述】:

我有一个 Python 对象列表,我想按对象本身的属性对其进行排序。该列表如下所示:

>>> ut
[<Tag: 128>, <Tag: 2008>, <Tag: <>, <Tag: actionscript>, <Tag: addresses>,
 <Tag: aes>, <Tag: ajax> ...]

每个对象都有一个计数:

>>> ut[1].count
1L

我需要按计数降序对列表进行排序。

我已经看到了几种方法,但我正在寻找 Python 中的最佳实践。

【问题讨论】:

复制:***.com/questions/157424/…,***.com/questions/222752/…,***.com/questions/327191/… Sorting HOW TO 对于那些正在寻找有关 Python 排序的更多信息的人。 除了 operator.attrgetter('attribute_name') 之外,您还可以使用仿函数作为 key,如 object_list.sort(key=my_sorting_functor('my_key')),故意将实现排除在外。 【参考方案1】:
# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)

# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)

更多关于sorting by keys。

【讨论】:

没问题。顺便说一句,如果 muhuk 是正确的并且它是 Django 对象的列表,您应该考虑他的解决方案。但是,对于排序对象的一般情况,我的解决方案可能是最佳实践。 在大型列表中,使用 operator.attrgetter('count') 作为键可以获得更好的性能。这只是此答案中 lambda 函数的优化(较低级别)形式。 感谢您的出色回答。如果它是一个字典列表并且 'count' 是它的键之一,那么它需要更改如下: ut.sort(key=lambda x: x['count'], reverse=True) 我认为它值得以下更新:如果需要按多个字段排序,可以通过连续调用 sort() 来实现,因为 python 使用的是稳定的排序算法。 我收到此错误,有人可以添加答案如何解决吗? ValueError:具有多个元素的数组的真值不明确。使用 a.any() 或 a.all()【参考方案2】:

一种最快的方法是使用operator.attrgetter("count"),尤其是在您的列表有很多记录的情况下。但是,这可能会在 Python 的预操作员版本上运行,因此最好有一个回退机制。然后,您可能需要执行以下操作:

try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it's faster than lambda

ut.sort(key=keyfun, reverse=True) # sort in-place

【讨论】:

这里我会使用变量名“keyfun”而不是“cmpfun”以避免混淆。 sort() 方法也通过 cmp= 参数接受比较函数。 如果对象具有动态添加的属性,这似乎不起作用(如果您在 __init__ 方法之后完成了 self.__dict__ = 'some':'dict')。不过,我不知道为什么会有所不同。 @tutuca:我从未替换过实例__dict__。请注意,“具有动态添加属性的对象”和“设置对象的__dict__ 属性”几乎是正交概念。我这么说是因为您的评论似乎暗示设置 __dict__ 属性是动态添加属性的要求。 @tzot:我正在看这个:github.com/stochastic-technologies/goatfish/blob/master/… 并在此处使用该迭代器:github.com/TallerTechnologies/dishey/blob/master/app.py#L28 引发属性错误。可能是因为python3,但还是…… @tzot:如果我了解operator.attrgetter 的用法,我可以提供一个具有任何属性名称的函数并返回一个排序后的集合。【参考方案3】:

读者应该注意到key=方法:

ut.sort(key=lambda x: x.count, reverse=True)

比向对象添加丰富的比较运算符要快很多倍。我很惊讶地读到这个(“Python in a Nutshell”的第 485 页)。您可以通过在这个小程序上运行测试来确认这一点:

#!/usr/bin/env python
import random

class C:
    def __init__(self,count):
        self.count = count

    def __cmp__(self,other):
        return cmp(self.count,other.count)

longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]

longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs

我的,非常小的测试显示,第一种速度慢了 10 倍以上,但书上说它通常只慢 5 倍左右。他们说的原因是由于python中使用的高度优化的排序算法(timsort)。

不过,.sort(lambda) 比普通的旧 .sort() 更快,这很奇怪。我希望他们能解决这个问题。

【讨论】:

定义__cmp__相当于调用.sort(cmp=lambda),而不是.sort(key=lambda),所以一点都不奇怪。 @tzot 完全正确。第一种必须一次又一次地比较对象。第二种排序只访问每个对象一次以提取其计数值,然后执行高度优化的简单数字排序。更公平的比较是longList2.sort(cmp = cmp)。我试过了,它的表现几乎和.sort() 一样。 (另外:请注意,“cmp”排序参数已在 Python 3 中删除。) cmp 在 Python 3 中已弃用:docs.python.org/3/howto/…【参考方案4】:

面向对象的方法

最好将对象排序逻辑(如果适用)作为类的属性,而不是在需要排序的每个实例中合并。

这确保了一致性并消除了对样板代码的需求。

至少,您应该指定__eq____lt__ 操作才能使其工作。然后只需使用sorted(list_of_objects)

class Card(object):

    def __init__(self, rank, suit):
        self.rank = rank
        self.suit = suit

    def __eq__(self, other):
        return self.rank == other.rank and self.suit == other.suit

    def __lt__(self, other):
        return self.rank < other.rank

hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand]  # [10, 2, 12, 13, 14]

hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted]  # [2, 10, 12, 13, 14]

【讨论】:

这就是我想要的!您能否向我们指出一些详细说明为什么 __eq____lt__ 是最低实现要求的文档? @FriendFX,我相信这是this暗示的:•The sort routines are guaranteed to use __lt__() when making comparisons between two objects... @FriendFX:查看portingguide.readthedocs.io/en/latest/comparisons.html进行比较和排序【参考方案5】:
from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)

【讨论】:

【参考方案6】:

它看起来很像 Django ORM 模型实例的列表。

为什么不在这样的查询中对它们进行排序:

ut = Tag.objects.order_by('-count')

【讨论】:

是的,但是使用了 django-tagging,所以我使用了一个内置的方法来获取特定查询集的标签集,如下所示: Tag.objects.usage_for_queryset(QuerySet, counts =真)【参考方案7】:

在对象类中添加丰富的比较运算符,然后使用列表的sort()方法。 见rich comparison in python。


更新:虽然这种方法可行,但我认为 Triptych 的解决方案更适合您的情况,因为它更简单。

【讨论】:

【参考方案8】:

如果您要排序的属性是一个属性,那么您可以避免导入operator.attrgetter 并改用属性的fget 方法。

例如,对于具有属性radius 的类Circle,我们可以按半径对circles 列表进行排序,如下所示:

result = sorted(circles, key=Circle.radius.fget)

这不是最广为人知的功能,但经常为我节省导入的一行。

【讨论】:

以上是关于如何根据对象的属性对对象列表进行排序?的主要内容,如果未能解决你的问题,请参考以下文章

如何根据属性值对对象列表进行排序

Python:根据属性对对象列表进行排序

Python入门题045:根据对象属性进行排序

如何根据布尔属性对对象数组进行排序?

如何根据 Aurelia/Typescript 中的嵌套属性对对象数组进行排序

如何根据另一个数组的顺序对对象数组进行排序?