从 Django 获取多个随机对象时,查询集如何工作?
Posted
技术标签:
【中文标题】从 Django 获取多个随机对象时,查询集如何工作?【英文标题】:How do querysets work when getting multiple random objects from Django? 【发布时间】:2015-01-28 06:26:26 【问题描述】:我需要从 Django 模型中获取多个随机对象。
我知道我可以通过键入以下内容从模型 Person 中获取一个随机对象:
person = Person.objects.order_by('?')[0]
然后,我在How to get two random records with Django 中看到建议说我可以通过以下方式简单地做到这一点:
people = Person.objects.order_by('?')[0:n]
但是,只要我添加了 [0:n],Django 就不会返回对象,而是返回一个 QuerySet 对象。这会导致不幸的后果,如果我再要求
print(people[0].first_name, people[0].last_name)
我得到了 2 个不同人的名字和姓氏,因为 QuerySet 在被调用时被评估(对吗?)。如何获取从第一个查询返回的实际人员列表?
我正在使用 Python 3.4.0 和 Django 1.7.1
【问题讨论】:
【参考方案1】:Simeon Popov 的回答解决了这个问题,但让我解释一下它的出处。
您可能知道查询集是惰性的,只有在必要时才会对其进行评估。它们还有一个内部缓存,一旦评估 整个 查询集就会被填充。如果只从查询集中获取单个对象(或指定了step
的切片,即[0:n:2]
),Django 会评估它,但结果不会被缓存。
举两个例子:
示例 1
>>> people = Person.objects.order_by('?')[0:n]
>>> print(people[0].first_name, people[0].last_name)
# first and last name of different people
示例 2
>>> people = Person.objects.order_by('?')[0:n]
>>> for person in people:
>>> print(person.first_name, person.last_name)
# first and last name are properly matched
在示例 1 中,当您访问第一个项目时,尚未评估查询集。它不会被缓存,因此当您再次访问第一项时,它会在数据库上运行另一个查询。
在第二个示例中,整个查询集在您循环时进行评估。因此,缓存被填满,并且不会有任何额外的数据库查询会改变返回项目的顺序。在这种情况下,名称彼此正确对齐。
评估整个查询集的方法是 a.o.迭代,list()
、bool()
和 len()
。这些方法之间存在一些细微差别。如果您只想确保查询集被缓存,我建议使用bool()
,即:
>>> people = Person.objects.order_by('?')[0:n]
>>> bool(people)
True
>>> print(people[0].first_name, people[0].last_name)
# matching names
【讨论】:
这看起来很奇怪,你可以使用参数调用函数,并修改参数的行为。有没有办法确定一个函数是否会对查询集产生这种影响?还有更多的类,比如具有类似属性的查询集吗? @Gunnar:实际上,这是编程中相当普遍的概念,它被称为“可变”对象。例如。元组不能更改(不可变),每个突变都返回一个副本,但列表是可变的,append
之类的函数实际上会更改列表实例本身。它是list.append(item)
而不是append(list, item)
的事实纯粹是为了使它更易于访问并防止它弄乱全局命名空间。查询集是唯一的,因为某些函数 (bool()
) 最初会因为缓存的实现方式而对看似不相关的属性(顺序)产生影响。【参考方案2】:
试试这个……
people = []
for person in Person.objects.order_by('?')[0:n]:
people.append(person)
【讨论】:
它有效,谢谢。我还发现简单地说 people = list(Person.objects.order_by('?')[0:n]) 也可以。 你的解决方案更好......但这是我心中的第一个:D以上是关于从 Django 获取多个随机对象时,查询集如何工作?的主要内容,如果未能解决你的问题,请参考以下文章