Django--QuerySet

Posted 2021-02-04 nanfeiyan

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Django--QuerySet相关的知识，希望对你有一定的参考价值。

一、QuerySet API 数据库接口

从数据库中查询出来的结果一般是一个集合，这个集合叫做 QuerySet。

1. QuerySet 创建对象的方法：

一共有四种方法
# 方法 1   Author.objects.create(name="WeizhongTu", email="[email protected]")
# 方法 2   twz = Author(name="WeizhongTu", email="[email protected]")
twz.save()
# 方法 3  twz = Author()
twz.name="WeizhongTu"
twz.email="[email protected]"
twz.save()
# 方法 4，首先尝试获取，不存在就创建，可以防止重复
Author.objects.get_or_create(name="WeizhongTu", email="[email protected]")
# 返回值(object, True/False)

备注：前三种方法返回的都是对应的 object，最后一种方法返回的是一个元组，(object, True/False)，创建时返回 True, 已经存在时返回 False

2. 获取对象的方法（上一篇的部分代码）

Person.objects.all() # 查询所有
Person.objects.all()[:10] 切片操作，获取10个人，不支持负索引，切片可以节约内存，不支持负索引，后面有相应解决办法，第7条
Person.objects.get(name="WeizhongTu") # 名称为 WeizhongTu 的一条，多条会报错

get是用来获取一个对象的，如果需要获取满足条件的一些人，就要用到filter
Person.objects.filter(name="abc") # 等于Person.objects.filter(name__exact="abc") 名称严格等于 "abc" 的人
Person.objects.filter(name__iexact="abc") # 名称为 abc 但是不区分大小写，可以找到 ABC, Abc, aBC，这些都符合条件

Person.objects.filter(name__contains="abc") # 名称中包含 "abc"的人
Person.objects.filter(name__icontains="abc") #名称中包含 "abc"，且abc不区分大小写

Person.objects.filter(name__regex="^abc") # 正则表达式查询
Person.objects.filter(name__iregex="^abc")# 正则表达式不区分大小写

# filter是找出满足条件的，当然也有排除符合某条件的
Person.objects.exclude(name__contains="WZ") # 排除包含 WZ 的Person对象
Person.objects.filter(name__contains="abc").exclude(age=23) # 找出名称含有abc, 但是排除年龄是23岁的

3. 删除符合条件的结果

和上面类似，得到满足条件的结果，然后 delete 就可以(危险操作，正式场合操作务必谨慎)，比如：

Person.objects.filter(name__contains="abc").delete() # 删除 名称中包含 "abc"的人

如果写成 
people = Person.objects.filter(name__contains="abc")
people.delete()
效果也是一样的，Django实际只执行一条 SQL 语句。

4. 更新某个内容

(1) 批量更新，适用于 .all() .filter() .exclude() 等后面 (危险操作，正式场合操作务必谨慎)

Person.objects.filter(name__contains="abc").update(name=‘xxx‘) # 名称中包含 "abc"的人 都改成 xxx
Person.objects.all().delete() # 删除所有 Person 记录

(2) 单个 object 更新，适合于 .get(), get_or_create(), update_or_create() 等得到的 obj，和新建很类似。

twz = Author.objects.get(name="WeizhongTu")
twz.name="WeizhongTu"
twz.email="[email protected]"
twz.save()  # 最后不要忘了保存！！！

5. QuerySet 是可迭代的，比如：

es = Entry.objects.all()
for e in es:
    print(e.headline)

Entry.objects.all() 或者 es 就是 QuerySet 是查询所有的 Entry 条目。

注意事项：

(1). 如果只是检查 Entry 中是否有对象，应该用 Entry.objects.all().exists()

(2). QuerySet 支持切片 Entry.objects.all()[:10] 取出10条，可以节省内存

(3). 用 len(es) 可以得到Entry的数量，但是推荐用 Entry.objects.count()来查询数量，后者用的是SQL：SELECT COUNT(*)

(4). list(es) 可以强行将 QuerySet 变成列表

6. QuerySet 是可以用pickle序列化到硬盘再读取出来的

>>> import pickle
>>> query = pickle.loads(s)     # Assuming ‘s‘ is the pickled string.
>>> qs = MyModel.objects.all()
>>> qs.query = query            # Restore the original ‘query‘.

7. QuerySet 查询结果排序

作者按照名称排序

Author.objects.all().order_by(‘name‘)
Author.objects.all().order_by(‘-name‘) # 在 column name 前加一个负号，可以实现倒序

8. QuerySet 支持链式查询

Author.objects.filter(name__contains="WeizhongTu").filter(email="[email protected]")
Author.objects.filter(name__contains="Wei").exclude(email="[email protected]")

# 找出名称含有abc, 但是排除年龄是23岁的
Person.objects.filter(name__contains="abc").exclude(age=23)

9. QuerySet 不支持负索引

Person.objects.all()[:10] 切片操作，前10条
Person.objects.all()[-10:] 会报错！！！

# 1. 使用 reverse() 解决
Person.objects.all().reverse()[:2] # 最后两条
Person.objects.all().reverse()[0] # 最后一条

# 2. 使用 order_by，在栏目名（column name）前加一个负号
Author.objects.order_by(‘-id‘)[:20] # id最大的20条

10. QuerySet 重复的问题，使用 .distinct() 去重

一般的情况下，QuerySet 中不会出来重复的，重复是很罕见的，但是当跨越多张表进行检索后，结果并到一起，可能会出来重复的值（我最近就遇到过这样的问题）

qs1 = Pathway.objects.filter(label__name=‘x‘)
qs2 = Pathway.objects.filter(reaction__name=‘A + B >> C‘)
qs3 = Pathway.objects.filter(inputer__name=‘WeizhongTu‘)

# 合并到一起
qs = qs1 | qs2 | qs3
这个时候就有可能出现重复的

# 去重方法
qs = qs.distinct()

二、

1. 查看 Django queryset 执行的 SQL

print str(User.objects.all().query)

print str(Author.objects.filter(name="WeizhongTu").query)

2. values_list 获取元组形式结果

2.1 比如我们要获取作者的 name 和 qq authors = Author.objects.values_list(‘name‘, ‘qq‘)

如果只需要 1 个字段，可以指定 flat=True Author.objects.values_list(‘name‘, flat=True)

3. values 获取字典形式的结果

3.1 比如我们要获取作者的 name 和 qq Author.objects.values(‘name‘, ‘qq‘) list(Author.objects.values(‘name‘, ‘qq‘))

3.2 查询 twz915 这个人的文章标题 Article.objects.filter(author__name=‘twz915‘).values(‘title‘)

注意：

1. values_list 和 values 返回的并不是真正的列表或字典，也是 queryset，他们也是 lazy evaluation 的（惰性评估，通俗地说，就是用的时候才真正的去数据库查）

2. 如果查询后没有使用，在数据库更新后再使用，你发现得到在是新内容！！！如果想要旧内容保持着，数据库更新后不要变，可以 list 一下

3. 如果只是遍历这些结果，没有必要 list 它们转成列表（浪费内存，数据量大的时候要更谨慎！！！）

4. extra 实现别名，条件，排序等

extra 中可实现别名，条件，排序等，后面两个用 filter, exclude 一般都能实现，排序用 order_by 也能实现。

别名： tags = Tag.objects.all().extra(select={‘tag_name‘: ‘name‘})

5. annotate 聚合计数，求和，平均数等

5.1 计数

我们来计算一下每个作者的文章数（我们每个作者都导入的Article的篇数一样，所以下面的每个都一样）

Article.objects.all().values(‘author_id‘).annotate(count=Count(‘author‘)).values(‘author_id‘, ‘count‘)

5.2 求和与平均值

5.2.1 求一个作者的所有文章的得分(score)平均值

Article.objects.values(‘author_id‘).annotate(avg_score=Avg(‘score‘)).values(‘author_id‘, ‘avg_score‘)

5.2.2 求一个作者所有文章的总分

Article.objects.values(‘author__name‘).annotate(sum_score=Sum(‘score‘)).values(‘author__name‘, ‘sum_score‘)

6. select_related 优化一对一，多对一查询

articles = Article.objects.all()[:10] 这样会进行多次数据库查询。

articles = Article.objects.all().select_related(‘author‘)[:10] 这样只进行一次数据库查询。

7. prefetch_related 优化一对多，多对多查询

和 select_related 功能类似，但是实现不同。

select_related 是使用 SQL JOIN 一次性取出相关的内容。

prefetch_related 用于一对多，多对多的情况，这时 select_related 用不了，因为当前一条有好几条与之相关的内容。

prefetch_related是通过再执行一条额外的SQL语句，然后用 Python 把两次SQL查询的内容关联（joining)到一起

articles = Article.objects.all()[:3] 多次执行查询语句

articles = Article.objects.all().prefetch_related(‘tags‘)[:3] 到第二条 SQL 语句，一次性查出了所有相关的内容。

8. defer 排除不需要的字段

在复杂的情况下，表中可能有些字段内容非常多，取出来转化成 Python 对象会占用大量的资源。

这时候可以用 defer 来排除这些字段，比如我们在文章列表页，只需要文章的标题和作者，没有必要把文章的内容也获取出来（因为会转换成python对象，浪费内存）

Article.objects.all()

Article.objects.all().defer(‘content‘)

9. only 仅选择需要的字段

和 defer 相反，only 用于取出需要的字段，假如我们只需要查出作者的名称

Author.objects.all().only(‘name‘) 使用only时一定包含主键id。

以上是关于Django--QuerySet的主要内容，如果未能解决你的问题，请参考以下文章