六分组数据
Posted 5250
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了六分组数据相关的知识,希望对你有一定的参考价值。
6.1 创建分组 group by
group by规定:
1).group by 可以包含任意数目的列,所以可以对分组进行嵌套;
2).若group by 中嵌套了分组,数据将在最后规定的分组上进行汇总;
3).group by 子句中列出的每个列都必须是检索列或有效表达式(不能是聚集函数);
4).如果分组的列中有NULL值,则将NULL作为一个单独分组返回;
5).group by 必须出现在where子句之后,order by子句之前。
>>> select vend_id,count(*) as num from products group by vend_id; #group by子句指按照vend_id分组并排序数据。
>>> select vend_id,count(*) as num from products group by vend_id order by num; #group by子句指按照vend_id分组再按num排序
6.2 过滤分组
where子句过滤的是行,having子句过滤的是分组。
where子句的所用到的技术和句法,having都支持。比如通配符,正则表达式,逻辑运算符等。
where子句在分组前进行过滤,having子句在分组后进行过滤。
>>> select cust_id,count(*) as num from orders group by cust_id having num>=2; #根据cust_id分组后,然后找出每组订单数>=2的数据
>>> select cust_id,count(*) as num from orders where Month(trade_date)=\'12\' and group by num>=2; #先找出12月份的订单,再根据cust_id分组后,然后找出每组订单数>=2的数据
6.3 分组和排序
分组自带排序,但是排序是以 分组的列排序的,若是指定其他的列排序,则需要order by子句
>>> select cust_id,SUM(qty*price) as amount from order group by cust_id having amount>=50; #根据用户分组,计算每个用户消费总额,过滤出总额大于50的客户
>>> select cust_id,SUM(qty*price) as amount from order group by cust_id having amount>=50 order by amount; #根据用户分组,计算每个用户消费总额,过滤出总额大于50的客户,最后按消费总额排序
6.4 子句顺序
目前已经学了where子句,order by子句, group by子句 having子句 limit子句。编写sql语句时各子句顺序如下:
select子句 > #要返回的列或表达式
from > #要检索的表
where子句 > #行级过滤
group by子句 > #分组说明
having子句 > #组级过滤
order by子句> #排序说明
limit子句 #检索的行数
django功能六
今日内容概要
-
聚合查询(聚合函数的使用)aggregate
max、min、sum、count、avg
-
分组查询(group by的使用)annotate
-
F与Q查询
-
django中如何开启事务
-
orm中常用字段及参数
-
数据库查询优化(only与defer、select_related与prefetch_related)
-
图书管理系统作业讲解
今日内容详细
聚合查询
# 聚合查询 aggregate
"""
聚合查询通常情况下都是配合分组一起使用的
只要是跟数据库相关的模块
基本上都在django.db.models里面
如果上述没有那么应该在django.db里面
"""
from app01 import models
from django.db.models import Max,Min,Sum,Count,Avg
# 1 所有书的平均价格
# res = models.Book.objects.aggregate(Avg(‘price‘))
# print(res)
# 2.上述方法一次性使用
res = models.Book.objects.aggregate(Max(‘price‘),Min(‘price‘),Sum(‘price‘),Count(‘pk‘),Avg(‘price‘))
print(res)
分组查询
# 分组查询 annotate
"""
MySQL分组查询都有哪些特点
分组之后默认只能获取到分组的依据 组内其他字段都无法直接获取了
严格模式
ONLY_FULL_GROUP_BY
"""
from django.db.models import Max, Min, Sum, Count, Avg
# 1.统计每一本书的作者个数
# res = models.Book.objects.annotate() # models后面点什么 就是按什么分组
# res = models.Book.objects.annotate(author_num=Count(‘authors‘)).values(‘title‘,‘author_num‘)
"""
author_num是我们自己定义的字段 用来存储统计出来的每本书对应的作者个数
"""
# res1 = models.Book.objects.annotate(author_num=Count(‘authors__id‘)).values(‘title‘,‘author_num‘)
# print(res,res1)
"""
代码没有补全 不要怕 正常写
补全给你是pycharm给你的 到后面在服务器上直接书写代码 什么补全都没有 颜色提示也没有
"""
# 2.统计每个出版社卖的最便宜的书的价格(作业:复习原生SQL语句 写出来)
# res = models.Publish.objects.annotate(min_price=Min(‘book__price‘)).values(‘name‘,‘min_price‘)
# print(res)
# 3.统计不止一个作者的图书
# 1.先按照图书分组 求每一本书对应的作者个数
# 2.过滤出不止一个作者的图书
# res = models.Book.objects.annotate(author_num=Count(‘authors‘)).filter(author_num__gt=1).values(‘title‘,‘author_num‘)
# """
# 只要你的orm语句得出的结果还是一个queryset对象
# 那么它就可以继续无限制的点queryset对象封装的方法
#
# """
# print(res)
# 4.查询每个作者出的书的总价格
# res = models.Author.objects.annotate(sum_price=Sum(‘book__price‘)).values(‘name‘,‘sum_price‘)
# print(res)
"""
如果我想按照指定的字段分组该如何处理呢?
models.Book.objects.values(‘price‘).annotate()
后续BBS作业会使用
你们的机器上如果出现分组查询报错的情况
你需要修改数据库严格模式
"""
F与Q查询
# F查询
# 1.查询卖出数大于库存数的书籍
# F查询
"""
能够帮助你直接获取到表中某个字段对应的数据
"""
from django.db.models import F
# res = models.Book.objects.filter(maichu__gt=F(‘kucun‘))
# print(res)
# 2.将所有书籍的价格提升500块
# models.Book.objects.update(price=F(‘price‘) + 500)
# 3.将所有书的名称后面加上爆款两个字
"""
在操作字符类型的数据的时候 F不能够直接做到字符串的拼接
"""
from django.db.models.functions import Concat
from django.db.models import Value
models.Book.objects.update(title=Concat(F(‘title‘), Value(‘爆款‘)))
# models.Book.objects.update(title=F(‘title‘) + ‘爆款‘) # 所有的名称会全部变成空白
# Q查询
# 1.查询卖出数大于100或者价格小于600的书籍
# res = models.Book.objects.filter(maichu__gt=100,price__lt=600)
"""filter括号内多个参数是and关系"""
from django.db.models import Q
# res = models.Book.objects.filter(Q(maichu__gt=100),Q(price__lt=600)) # Q包裹逗号分割 还是and关系
# res = models.Book.objects.filter(Q(maichu__gt=100)|Q(price__lt=600)) # | or关系
# res = models.Book.objects.filter(~Q(maichu__gt=100)|Q(price__lt=600)) # ~ not关系
# print(res) # <QuerySet []>
# Q的高阶用法 能够将查询条件的左边也变成字符串的形式
q = Q()
q.connector = ‘or‘
q.children.append((‘maichu__gt‘,100))
q.children.append((‘price__lt‘,600))
res = models.Book.objects.filter(q) # 默认还是and关系
print(res)
django中如何开启事务
"""
事务
ACID
原子性
不可分割的最小单位
一致性
跟原子性是相辅相成
隔离性
事务之间互相不干扰
持久性
事务一旦确认永久生效
事务的回滚
rollback
事务的确认
commit
"""
# 目前你只需要掌握Django中如何简单的开启事务
# 事务
from django.db import transaction
try:
with transaction.atomic():
# sql1
# sql2
...
# 在with代码快内书写的所有orm操作都是属于同一个事务
except Exception as e:
print(e)
print(‘执行其他操作‘)
orm中常用字段及参数
AutoField
主键字段 primary_key=True
CharField varchar
verbose_name 字段的注释
max_length 长度
IntegerField int
BigIntegerField bigint
DecimalField
max_digits=8
decimal_places=2
EmailFiled varchar(254)
DateField date
DateTimeField datetime
auto_now:每次修改数据的时候都会自动更新当前时间
auto_now_add:只在创建数据的时候记录创建时间后续不会自动修改了
BooleanField(Field) - 布尔值类型
该字段传布尔值(False/True) 数据库里面存0/1
TextField(Field) - 文本类型
该字段可以用来存大段内容(文章、博客...) 没有字数限制
后面的bbs作业 文章字段用的就是TextField
FileField(Field) - 字符类型
upload_to = "/data"
给该字段传一个文件对象,会自动将文件保存到/data目录下然后将文件路径保存到数据库中
/data/a.txt
后面bbs作业也会涉及
# 更多字段
直接参考博客:https://www.cnblogs.com/Dominic-Ji/p/9203990.html
# django除了给你提供了很多字段类型之外 还支持你自定义字段
class MyCharField(models.Field):
def __init__(self,max_length,*args,**kwargs):
self.max_length = max_length
# 调用父类的init方法
super().__init__(max_length=max_length,*args,**kwargs) # 一定要是关键字的形式传入
def db_type(self, connection):
"""
返回真正的数据类型及各种约束条件
:param connection:
:return:
"""
return ‘char(%s)‘%self.max_length
# 自定义字段使用
myfield = MyCharField(max_length=16,null=True)
# 外键字段及参数
unique=True
ForeignKey(unique=True) === OneToOneField()
# 你在用前面字段创建一对一 orm会有一个提示信息 orm推荐你使用后者但是前者也能用
db_index
如果db_index=True 则代表着为此字段设置索引
(复习索引是什么)
to_field
设置要关联的表的字段 默认不写关联的就是另外一张的主键字段
on_delete
当删除关联表中的数据时,当前表与其关联的行的行为。
"""
django2.X及以上版本 需要你自己指定外键字段的级联更新级联删除
"""
数据库查询优化
only与defer
select_related与prefetch_related
"""
orm语句的特点:
惰性查询
如果你仅仅只是书写了orm语句 在后面根本没有用到该语句所查询出来的参数
那么orm会自动识别 直接不执行
"""
# only与defer
# res = models.Book.objects.all()
# print(res) # 要用数据了才会走数据库
# 想要获取书籍表中所有数的名字
# res = models.Book.objects.values(‘title‘)
# for d in res:
# print(d.get(‘title‘))
# 你给我实现获取到的是一个数据对象 然后点title就能够拿到书名 并且没有其他字段
# res = models.Book.objects.only(‘title‘)
# res = models.Book.objects.all()
# print(res) # <QuerySet [<Book: 三国演义爆款>, <Book: 红楼梦爆款>, <Book: 论语爆款>, <Book: 聊斋爆款>, <Book: 老子爆款>]>
# for i in res:
# print(i.title) # 点击only括号内的字段 不会走数据库
# print(i.price) # 点击only括号内没有的字段 会重新走数据库查询而all不需要走了
res = models.Book.objects.defer(‘title‘) # 对象除了没有title属性之外其他的都有
for i in res:
print(i.price)
"""
defer与only刚好相反
defer括号内放的字段不在查询出来的对象里面 查询该字段需要重新走数据
而如果查询的是非括号内的字段 则不需要走数据库了
"""
# select_related与prefetch_related
# select_related与prefetch_related 跟跨表操作有关
# res = models.Book.objects.all()
# for i in res:
# print(i.publish.name) # 每循环一次就要走一次数据库查询
# res = models.Book.objects.select_related(‘authors‘) # INNER JOIN
"""
select_related内部直接先将book与publish连起来 然后一次性将大表里面的所有数据
全部封装给查询出来的对象
这个时候对象无论是点击book表的数据还是publish的数据都无需再走数据库查询了
select_related括号内只能放外键字段 一对多 一对一
多对多也不行
"""
# for i in res:
# print(i.publish.name) # 每循环一次就要走一次数据库查询
res = models.Book.objects.prefetch_related(‘publish‘) # 子查询
"""
prefetch_related该方法内部其实就是子查询
将子查询查询出来的所有结果也给你封装到对象中
给你的感觉好像也是一次性搞定的
"""
for i in res:
print(i.publish.name)
以上是关于六分组数据的主要内容,如果未能解决你的问题,请参考以下文章
Mysql查询相关知识(进阶五:分组查询,进阶六 连接查询)