Django 聚合与查询集API

Posted 2020-10-02 三年一梦

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Django 聚合与查询集API相关的知识，希望对你有一定的参考价值。

本文从Django官方文档总结而来，将聚合的主要用法和查询集的常见方法做一归纳。

聚合

1. 聚合的产生来源于django数据库查询，通常我们使用django查询来完成增删查改，但是有时候需要更复杂的方法才能完成对数据的提取、筛选、更改，所以需要一组对象聚合来完成这种操作。模型举例如下：

from django.db import models

class Author(models.Model):
    name = models.CharField(max_length=100)
    age = models.IntegerField()

class Publisher(models.Model):
    name = models.CharField(max_length=300)
    num_awards = models.IntegerField()

class Book(models.Model):
    name = models.CharField(max_length=300)
    pages = models.IntegerField()
    price = models.DecimalField(max_digits=10, decimal_places=2)
    rating = models.FloatField()
    authors = models.ManyToManyField(Author)
    publisher = models.ForeignKey(Publisher)
    pubdate = models.DateField()

class Store(models.Model):
    name = models.CharField(max_length=300)
    books = models.ManyToManyField(Book)
    registered_users = models.PositiveIntegerField()

View Code

根据给出的模型，先引入三个例子：

# Total number of books.
>>> Book.objects.count()
2452

# Total number of books with publisher=BaloneyPress
>>> Book.objects.filter(publisher__name=‘BaloneyPress‘).count()
73

>>> from django.db.models import Avg
>>> Book.objects.all().aggregate(Avg(‘price‘))
{‘price__avg‘: 34.35}

注意几个点： .all() 和 .filter() 和 .count() 和 .aggregate() 为方法，前两者是返回新的查询集的方法（括号里面有参数），后两者是不返回查询集的方法。 publisher 显然为字段名， name为字段查找，两者之间以双下划线连接：__ price也是字段名，Avg 为聚合函数，用来求平均值。以上提及的方法、字段查找和聚合函数将在查询集API中介绍。那么，我们先介绍聚合。

2.django提供了两种生成聚合的方法

1）从整个查询集生成统计值，主要用法：aggregate(*args, **kwargs)

aggregate()是QuerySet 的一个终止子句，也就是说aggregate返回一个字典，包含根据QuerySet 计算得到的聚合值（平均数、和等等）。aggregate() 的每个参数指定返回的字典中将要包含的值。eg：

Book.objects.all()  # 返回所有图书的集合

>>> from django.db.models import Avg  # 引入用来求平均值的聚合函数 Avg
>>> Book.objects.all().aggregate(Avg(‘price‘))  # 要计算所有书的平均价格，通过在查询集后面附加aggregate()子句实现
{‘price__avg‘: 34.35} # 返回的是字典

>>> Book.objects.aggregate(Avg(‘price‘))  # all()在这里多余，可以省掉
{‘price__avg‘: 34.35}                     # 返回的字典中，键为聚合值的标识符，由字段和聚合函数的名称自动生成 ，值为计算出来的聚合值

>>> Book.objects.aggregate(average_price=Avg(‘price‘))
 {‘average_price‘: 34.35}                 # 为聚合值更换名称，提供参数average_price


>>> from django.db.models import Avg, Max, Min   # 生成了不止一个聚合
>>> Book.objects.aggregate(Avg(‘price‘), Max(‘price‘), Min(‘price‘)) 
{‘price__avg‘: 34.35, ‘price__max‘: Decimal(‘81.20‘), ‘price__min‘: Decimal(‘12.99‘)}

2）为查询集的每一项成聚合，主要用法：annotate(*args, **kwargs)

这种方法为每一个对象都生成一个独立的汇总值，比如，如果你在检索一列图书，你可能想知道每一本书有多少作者参与。每本书和作者是多对多的关系。我们想要汇总QuerySet.中每本书里的这种关系。逐个对象的汇总结果可以由annotate()子句生成。当annotate()子句被指定之后，QuerySet中的每个对象都会被注上特定的值。这些注解的语法都和aggregate()子句所使用的相同。annotate()的每个参数都描述了将要被计算的聚合。

# Build an annotated queryset
>>> from django.db.models import Count
>>> q = Book.objects.annotate(Count(‘authors‘)) # 和aggregate语法相同，不同的是annotate返回的q是各个对象，可用q[0],q[1]等取出对象
# Interrogate the first object in the queryset
>>> q[0]  # 返回的是第一个Book对象
<Book: The Definitive Guide to Django>
>>> q[0].authors__count   # 编写第一本书的作者数目为2， authors为Book模型中的字段名，count为字段查询，所以用双下划线连接
2
# Interrogate the second object in the queryset
>>> q[1]  # 返回的是第二个Book对象
<Book: Practical Django Projects>
>>> q[1].authors__count
1

>>> q = Book.objects.annotate(num_authors=Count(‘authors‘))  # 提供了自定义的num_authors别名代替了authors__count
>>> q[0].num_authors
2
>>> q[1].num_authors
1

与 aggregate() 不同的是， annotate() 不是一个终止子句。annotate()子句的返回结果是一个查询集 (QuerySet)；这个 QuerySet可以用任何QuerySet方法进行修改，包括 filter(), order_by()。发现aggregate 和 annotate用法的区别了吗，再次举例如下（在聚合函数中指定聚合字段时，Django 允许你使用同样的 双下划线 表示关联关系，）：

>>> from django.db.models import Max, Min
>>> Store.objects.annotate(min_price=Min(‘books__price‘), max_price=Max(‘books__price‘))
# 查找每个商店提供的图书的价格范围

>>> Store.objects.aggregate(min_price=Min(‘books__price‘), max_price=Max(‘books__price‘))
# 查找所有书店中最便宜的书和最贵的书的价格

>>> Store.objects.aggregate(youngest_age=Min(‘books__authors__age‘))
# 利用双下划线延伸关系链，查找所有书店中的所有作者的最小年龄

3. 聚合和其他查询子句

filter() 和 exclude()

>>> from django.db.models import Count, Avg
>>> Book.objects.filter(name__startswith="Django").annotate(num_authors=Count(‘authors‘))
# 使用annotate() 子句时，过滤器有限制注解对象的作用。例如，得到每本以 "Django" 为书名开头的图书作者的总数

>>> Book.objects.filter(name__startswith="Django").aggregate(Avg(‘price‘))
# 使用aggregate()子句时，过滤器有限制聚合对象的作用。例如，算出所有以 "Django" 为书名开头的图书平均价格

>>> Book.objects.annotate(num_authors=Count(‘authors‘)).filter(num_authors__gt=1)

# 得到不止一个作者的图书

注意以上annotate() 和 filter()子句的顺序，顺序不同查询结果也会不同（后者筛选的出版商为前者的子集。）：

>>> Publisher.objects.annotate(num_books=Count(‘book‘)).filter(book__rating__gt=3.0)
# 返回了至少出版了一本好书(评分大于 3 分)的出版商， 在这些出版商中包含出版商所发行的所有图书！（这些出版商中每个出版商只要发行过一本>3的书就算）

>>> Publisher.objects.filter(book__rating__gt=3.0).annotate(num_books=Count(‘book‘))

# 返回了至少出版了一本好书(评分大于 3 分)的出版商， 在这些出版商中只含有发行过好书的出版商！（这些出版商中每个出版商发行的所有书评分都必须>3）

order_by()

>>> Book.objects.annotate(num_authors=Count(‘authors‘)).order_by(‘num_authors‘) # 根据每本书的作者数量多少进行排序

values()

>>> Author.objects.annotate(average_rating=Avg(‘book__rating‘))
# 返回所有作者及他所著图书的平均评分

>>> Author.objects.values(‘name‘).annotate(average_rating=Avg(‘book__rating‘))
# 作者先按名称分组，意味着若两位作者同名则查询结果被合并！，两者均分被算为一个

>>> Author.objects.annotate(average_rating=Avg(‘book__rating‘)).values(‘name‘, ‘average_rating‘)

# 这段代码交换了value和average顺序，将给每个作者添加一个唯一的字段，但只有作者名称和average_rating 注解会返回在输出结果中

4.查询集（QuerySet）API 查询

本质上，可以创建、过滤、切片和传递查询集而不用真实操作数据库。在你对查询集做求值之前，不会发生任何实际的数据库操作。可以通过迭代、切片、序列化/缓存、repr()、len()、list()、bool()

1）返回新的查询集方法

filter()：返回一个新的QuerySet，包含与给定的查询参数匹配的对象。

exclude():返回一个新的QuerySet，它包含不满足给定的查找参数的对象。

annotate(*args, **kwargs): 使用提供的查询表达式Annotate查询集中的每个对象。
order_by(*fields): 默认情况下，QuerySet 根据模型Meta 类的ordering 选项排序。你可以使用order_by 方法给每个QuerySet 指定特定的排序。
...

QuerySet API参考

以上是关于Django 聚合与查询集API的主要内容，如果未能解决你的问题，请参考以下文章

django查询集API

查询集API -- Django从入门到精通系列教程

Django——model基础

Django聚合函数与分组查询

在 Django 中有一种方法可以聚合与相关对象上的条件的关系

Django 使用表达式聚合查询