ORM之基础操作进阶

Posted 2021-01-18 zzbj

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了ORM之基础操作进阶相关的知识，希望对你有一定的参考价值。

一、外键自关联(一对多)
1、建表
# 评论表
class Comment(models.Model):
    id = models.AutoField(primary_key=True)
    content = models.CharField(max_length=255)
    push_time = models.DateTimeField(auto_now_add=True)
    # 父评论：自关联,一个评论可以没有父评论所以null=True
    pcomment = models.ForeignKey(to=‘self‘, null=True)

    def __str__(self):
        return self.content

2、表数据




2、操作
1.找到id等于2的那个评论的所有子评论(跨表查询)
ret = Comment.objects.filter(pcomment__id=2)
print(ret)

2.方法2(直接查询)
ret = Comment.objects.filter(pcomment_id=2)
print(ret)

3.方法3
ret = Comment.objects.filter(id=2).values(‘comment__id‘)
print(ret)



二、多对多自关联
1、建表
class Person(models.Model):
    name = models.CharField(max_length=12)
    friends = models.ManyToManyField(to=‘self‘, symmetrical=False)

    def __str__(self):
        return self.name


2、注意
在多对多的自关联时，如果需要反向查找，则需要添加symmetrical这个字段，
指定内部是否创建反向操作的字段，默认为True，需要反向查找则改成False


3、操作
1.找到小明的朋友(正向找)
ret = Person.objects.filter(name=‘小明‘).values(‘friends__name‘)
print(ret)

2.朋友是小明的那个人(反向找)
ret = Person.objects.get(name=‘小明‘).person_set.all()
print(ret)
或者
ret = Person.objects.filter(name=‘小明‘).values(‘person__name‘)
print(ret)



三、补充的几个方法
1、这几个方法适用于一对多和多对多的情况,
且只是对象才能使用，就是obj.get()、obj.first()、obj.last()才能使用

它存在于下面两种情况：
    外键关系的反向查询
    多对多关联关系
    简单来说就是当 点后面的对象 可能存在多个的时候就可以使用以下的方法

2、方法
1.create(关键字参数)
    创建一个新的对象，保存对象，并将它添加到关联对象集之中，返回新创建的对象。

2.add(位置参数)
    把指定的model对象添加到关联对象集中。
    但是一对多中add里面的实参(位置参数)是对象
    而多对多中add里面的实参(位置参数)可以是id

3.set([列表])
    更新model对象的关联对象。
    但是一对多中set里面的实参(列表)是对象
    而多对多中add里面的实参(列表)可以是id

4.remove()
    从关联对象集中移除执行的model对象

5.clear()
    从关联对象集中移除一切对象。
    注意：
        对于ForeignKey对象，clear()和remove()方法仅在null=True时存在。

    举个例子：
    ForeignKey字段没设置null=True时，
    class Book(models.Model):
        title = models.CharField(max_length=32)
        publisher = models.ForeignKey(to=Publisher)
    
    没有clear()和remove()方法

    >>> models.Publisher.objects.first().book_set.clear()
    Traceback (most recent call last):
      File "<input>", line 1, in <module>
    AttributeError: ‘RelatedManager‘ object has no attribute ‘clear‘

    
    当ForeignKey字段设置null=True时，
    class Book(models.Model):
        name = models.CharField(max_length=32)
        publisher = models.ForeignKey(to=Class, null=True)
    此时就有clear()和remove()方法

    >>> models.Publisher.objects.first().book_set.clear()
 

6.注意
    对于所有类型的关联字段，add()、create()、remove()和clear(),set()都会马上更新数据库。换句话说，在关联的任何一端，都不需要再调用save()方法。

7.建表
class MyClass(models.Model):
    cname = models.CharField(max_length=12)


class Student(models.Model):
    sname = models.CharField(max_length=12)
    myclass = models.ForeignKey(to=‘MyClass‘)

    def __str__(self):
        return self.sname


class Teacher(models.Model):
    tname = models.CharField(max_length=12)
    myclass = models.ManyToManyField(to=‘MyClass‘)

8.例子
    1.一对多
    # 查询id=2的班级的所有学生
    ret = MyClass.objects.get(id=2).student_set.all()
    print(ret)

    # id=2的班级的所有老师
    ret = MyClass.objects.get(id=2).teacher_set.all()
    print(ret)

    # 给id=1的班级添加一个id=4的学生
    student_obj = Student.objects.get(id=4)
    MyClass.objects.get(id=1).student_set.add(student_obj)
    ret = MyClass.objects.get(id=1).student_set.all()
    print(ret)

    # 把所有学生都绑定到id=1的班级中
    MyClass.objects.get(id=1).student_set.set(Student.objects.all())
    ret = MyClass.objects.get(id=1).student_set.all()
    print(ret)

    2.多对多
    # 给id=2的老师添加一个id=4的班级
    Teacher.objects.get(id=2).myclass.add(4)

    # 从id=2的老师的中移除2班
    Teacher.objects.get(id=2).myclass.remove(2)

    # 清空id=2的老师的班级
    Teacher.objects.get(id=2).myclass.clear()

    # 给id=2的老师新增一门课：生理课
    Teacher.objects.get(id=2).myclass.create(cname=‘生理课‘)



四、如何在Django终端打印SQL语句
在Django项目的settings.py文件中，在最后复制粘贴如下代码：
LOGGING = {
    ‘version‘: 1,
    ‘disable_existing_loggers‘: False,
    ‘handlers‘: {
        ‘console‘:{
            ‘level‘:‘DEBUG‘,
            ‘class‘:‘logging.StreamHandler‘,
        },
    },
    ‘loggers‘: {
        ‘django.db.backends‘: {
            ‘handlers‘: [‘console‘],
            ‘propagate‘: True,
            ‘level‘:‘DEBUG‘,
        },
    }
}

即为你的Django项目配置上一个名为django.db.backends的logger实例即可查看翻译后的SQL语句。 



五、基于对象的跟新(save)和基于QuerySet的update跟新的区别
# 把南山出版社的ceo改成小红
# 1. 基于对象的修改(会跟新所有字段，效率慢)
publisher_obj = Publisher.objects.get(name=‘南山出版社‘)
publisher_obj.ceo = ‘小红‘
publisher_obj.save()

# 2. 基于QuerySet的update跟新(只跟新指定的字段，效率快于基于对象的修改)
Publisher.objects.filter(name=‘南山出版社‘).update(ceo=‘小勾‘)



六、聚合查询
1、介绍
aggregate()是QuerySet的一个终止子句，意思是说，它返回一个包含一些键值对的字典。
键的名称是聚合值的标识符，值是计算出来的聚合值。键的名称是按照字段和聚合函数的名称自动生成出来的。
用到的内置函数：
from django.db.models import Avg, Sum, Max, Min, Count

2、例子
from django.db.models import Avg, Sum, Max, Min, Count
# 求所有书中价格最高的书
ret = Book.objects.all().aggregate(Max(‘price‘))
print(ret)

# 为聚合值指定一个名称，返回指定的key值
ret = Book.objects.all().aggregate(max_price=Max(‘price‘))
print(ret)

# 生成不止一个聚合，求所有书的平均价格和最小的价格
ret = Book.objects.all().aggregate(avg_price=Avg(‘price‘), min_price=Min(‘price‘))
print(ret)



七、分组查询
1、介绍
values/values_list 对应 SQL语句 select 部分
filter 对应 SQL语句 where 部分

2、ORM中分组使用annotate
1. annotate前面查询(values)的是什么，就按什么分组，没有values就默认按id分组，而id是唯一的，因此不写values等于没有分组
2. annotate中要写上分组之后要做的事情

3、建表
class Employee(models.Model):
    name = models.CharField(max_length=12)
    age = models.IntegerField()
    salary = models.IntegerField()
    province = models.CharField(max_length=12)
    dept = models.CharField(max_length=12)

4、例子
from django.db.models import Avg, Sum, Max, Min, Count
# 使用ORM查询每个部门的平均工资
ret = Employee.objects.values(‘dept‘).annotate(avg=Avg(‘salary‘))
print(ret)

ret = Employee.objects.annotate(avg=Avg(‘salary‘)).values(‘dept‘, ‘avg‘)
print(ret)  # 等于没有分组

# 每个部门的平均年龄
ret = Employee.objects.values(‘dept‘).annotate(Avg(‘age‘)).values_list(‘dept‘, ‘avg_age‘)
print(ret)


4、多表使用分组
class Publisher(models.Model):
    id = models.AutoField(primary_key=True)
    name = models.CharField(max_length=16)
    addr = models.TextField()
    # 成立日期：对应Python中的datetime.date类型
    date = models.DateField()

    def __str__(self):
        return self.name


class Book(models.Model):
    # 书名
    title = models.CharField(max_length=16)
    # 价格：最多显示6个数字，小数位有2个
    price = models.DecimalField(max_digits=6, decimal_places=2)
    # ISBN：书籍的唯一编号
    isbn = models.CharField(max_length=20, unique=True)
    # 外键关联出版社,db_constraint=False不在数据库中建立约束
    publisher = models.ForeignKey(to=‘Publisher‘, on_delete=models.CASCADE, related_name=‘books‘)

    def __str__(self):
        return self.title


class Author(models.Model):
    name = models.CharField(max_length=12)
    # 性别，choice选项用的是本模块定义的常量，默认选保密
    gender = models.SmallIntegerField(choices=((1, ‘男‘), (2, ‘女‘), (3, ‘保密‘)), default=3)
    # 手机号，唯一约束
    phone = models.CharField(max_length=11, unique=True)
    # 邮箱
    email = models.EmailField()
    # 多对多关联书籍
    books = models.ManyToManyField(to=‘Book‘, related_name=‘authors‘)

例子：
from django.db.models import Avg, Sum, Max, Min, Count
# 求每个出版社出版的书的平均价格
ret = Book.objects.values(‘publisher_id‘).annotate(avg_price=Avg(‘price‘)).values_list(‘publisher__name‘, ‘avg_price‘)
print(ret)

# 求每个出版社出版的书的数量
ret = Book.objects.values(‘publisher_id‘).annotate(count=Count(‘id‘)).values_list(‘publisher__name‘, ‘count‘)
print(ret)




八、Q查询
filter()等方法中的关键字参数查询都是一起进行“AND” 的。 如果你需要执行更复杂的查询（例如OR语句），你可以使用Q对象。
同样是上面书籍出版社那个数据库
例如：
1、或 |
from django.db.models import Q
# 查询书的价格大于100或者作者是小明的书
ret = Book.objects.filter(Q(price__gt=100) | Q(authors__name=‘小明‘))
print(ret)

2、且 &
# 原生的 且
# 查询书的价格大于100且作者是小明的书
ret = Book.objects.filter(price__gt=100, authors__name=‘小明‘)
print(ret)

# Q对象的 且
from django.db.models import Q
ret = Book.objects.filter(Q(price__gt=100) & Q(authors__name=‘小明‘))
print(ret)

3、非 ~
from django.db.models import Q
ret = Book.objects.filter(Q(price__gt=100) & ~Q(authors__name=‘小明‘))
print(ret)


4、混合使用：
查询函数可以混合使用Q对象和关键字参数。所有提供给查询函数的参数(关键字参数或Q对象)都将进行‘END‘运算，
但是，如果出现Q对象，它必须位于所有关键字参数的前面。

# 查询出版社id是1或者2，且作者名字中有小的书
ret = Book.objects.filter(Q(publisher_id=1) | Q(publisher_id=2), authors__name__contains=‘小‘)
print(ret)



九、F查询
1、F()主要用于修改字段的值(数字)
例如：
from django.db.models import F
# F用来在字段原来的基础上进行操作
Book.objects.all().update(price=F(‘price‘)+20)

进行了上面的操作后，数据库中book表所有的price字段的值全部加了20，
比如本来90的，现在就110


2、拓展：修改字段的值(字符串)
from django.db.models import F
# 给每本书的名字加‘新款‘(注意：一般在实际中不应该这么做，这里只是用于了解F对象)
from django.db.models.functions import Concat  # 字符串拼接
from django.db.models import Value  # 把字符串转变成F对象可以操作的变量
Book.objects.all().update(title=Concat(F(‘title‘), Value(‘新款‘)))


十、事务
在事务代码块内的代码，全部都执行成功后，数据库中才会进行修改
只要存在一句错误的语句，全部代码都不会生效
一般使用在安全性需要很高的场景，比如，银行的转账，
为了避免一方转账后，中途出现断电，服务器异常等情况，导致另一方没收到转账，
而转账方的钱却减少了

from django.db import transaction

with transaction.atomic():
    # 创建一本书
    Book.objects.create(title=‘嘿嘿书‘, price=10.99, isbn=‘213dsxc‘, publisher_id=1)
    # 把id=100的书名修改为哈哈书
    book_obj = Book.objects.get(id=100)  # 没有id=100的书，这里会报错，结果是整体都不生效，数据库不会有任何修改
    book_obj.title = ‘哈哈书‘
    book_obj.save()



十一、去重distinct
ret = Book.objects.all().values(‘publisher__name‘).distinct()
print(ret)



十二、Django ORM执行原生SQL(拓展了解)
1、raw
1. 查询自己这个表
ret = Book.objects.raw(‘select * from app04_book‘)  # raw里面写原生的SQL语句
print(ret)

for i in ret:
    print(i.title, i.price)


2. 查询别的表
在Book表查询publisher表，select必须要写上publisher的主键，能使用的也只有主键，如果要使用其他字段，就在主键后写上其他字段
ret = Book.objects.raw(‘select id, name from app04_publisher‘)  
for i in ret:
    print(i.id, i.name)


拓展知识：在ORM中，使用的是懒查询，就是当你没有使用这个结果的时候，它是不会去数据库帮你查询的，
比如上面的 ret = Book.objects.raw(‘select * from app04_book‘) 当你print这个结果的时候，并不会有内容的
因为ORM没有看到你使用这个ret，它不会去数据库帮你查询的，而当你把ret进行循环的时候，ORM知道你要使用了，它才会
真正地去数据库帮你进行操作并返回结果给你。


2、直接执行自定义SQL
有时候raw()方法并不十分好用，很多情况下我们不需要将查询结果映射成模型，或者我们需要执行DELETE、 INSERT以及UPDATE操作。在这些情况下，我们可以直接访问数据库，完全避开模型层。
我们可以直接从django提供的接口中获取数据库连接，然后像使用pymysql模块一样操作数据库。

from django.db import connection, connections

connection获取默认的数据库
connections当有多个数据库的时候，使用关键字获取指定的数据库
connections[‘default‘]

例如：
from django.db import connection, connections
cursor = connection.cursor()
cursor.execute(‘select * from app04_book‘)
ret = cursor.fetchone()
print(ret)



十三、QuerySet方法大全

def all(self)
    # 获取所有的数据对象

def filter(self, *args, **kwargs)
    # 条件查询
    # 条件可以是：参数，字典，Q

def exclude(self, *args, **kwargs)
    # 条件查询
    # 条件可以是：参数，字典，Q

def select_related(self, *fields)
    性能相关：表之间进行join连表操作，一次性获取关联的数据。

    总结：
    1. select_related主要针一对一和多对一关系进行优化。
    2. select_related使用SQL的JOIN语句进行优化，通过减少SQL查询的次数来进行优化、提高性能。

def prefetch_related(self, *lookups)
    性能相关：多表连表操作时速度会慢，使用其执行多次SQL查询在Python代码中实现连表操作。

    总结：
    1. 对于多对多字段（ManyToManyField）和一对多字段，可以使用prefetch_related()来进行优化。
    2. prefetch_related()的优化方式是分别查询每个表，然后用Python处理他们之间的关系。

def annotate(self, *args, **kwargs)
    # 用于实现聚合group by查询

    from django.db.models import Count, Avg, Max, Min, Sum

    v = models.UserInfo.objects.values(‘u_id‘).annotate(uid=Count(‘u_id‘))
    # SELECT u_id, COUNT(ui) AS `uid` FROM UserInfo GROUP BY u_id

    v = models.UserInfo.objects.values(‘u_id‘).annotate(uid=Count(‘u_id‘)).filter(uid__gt=1)
    # SELECT u_id, COUNT(ui_id) AS `uid` FROM UserInfo GROUP BY u_id having count(u_id) > 1

    v = models.UserInfo.objects.values(‘u_id‘).annotate(uid=Count(‘u_id‘,distinct=True)).filter(uid__gt=1)
    # SELECT u_id, COUNT( DISTINCT ui_id) AS `uid` FROM UserInfo GROUP BY u_id having count(u_id) > 1

def distinct(self, *field_names)
    # 用于distinct去重
    models.UserInfo.objects.values(‘nid‘).distinct()
    # select distinct nid from userinfo

    注：只有在PostgreSQL中才能使用distinct进行去重

def order_by(self, *field_names)
    # 用于排序
    models.UserInfo.objects.all().order_by(‘-id‘,‘age‘)

def extra(self, select=None, where=None, params=None, tables=None, order_by=None, select_params=None)
    # 构造额外的查询条件或者映射，如：子查询

    Entry.objects.extra(select={‘new_id‘: "select col from sometable where othercol > %s"}, select_params=(1,))
    Entry.objects.extra(where=[‘headline=%s‘], params=[‘Lennon‘])
    Entry.objects.extra(where=["foo=‘a‘ OR bar = ‘a‘", "baz = ‘a‘"])
    Entry.objects.extra(select={‘new_id‘: "select id from tb where id > %s"}, select_params=(1,), order_by=[‘-nid‘])

 def reverse(self):
    # 倒序
    models.UserInfo.objects.all().order_by(‘-nid‘).reverse()
    # 注：如果存在order_by，reverse则是倒序，如果多个排序则一一倒序


 def defer(self, *fields):
    models.UserInfo.objects.defer(‘username‘,‘id‘)
    或
    models.UserInfo.objects.filter(...).defer(‘username‘,‘id‘)
    #映射中排除某列数据

 def only(self, *fields):
    #仅取某个表中的数据
     models.UserInfo.objects.only(‘username‘,‘id‘)
     或
     models.UserInfo.objects.filter(...).only(‘username‘,‘id‘)

 def using(self, alias):
     指定使用的数据库，参数为别名（setting中的设置）


##################################################
# PUBLIC METHODS THAT RETURN A QUERYSET SUBCLASS #
##################################################

def raw(self, raw_query, params=None, translations=None, using=None):
    # 执行原生SQL
    models.UserInfo.objects.raw(‘select * from userinfo‘)

    # 如果SQL是其他表时，必须将名字设置为当前UserInfo对象的主键列名
    models.UserInfo.objects.raw(‘select id as nid from 其他表‘)

    # 为原生SQL设置参数
    models.UserInfo.objects.raw(‘select id as nid from userinfo where nid>%s‘, params=[12,])

    # 将获取的到列名转换为指定列名
    name_map = {‘first‘: ‘first_name‘, ‘last‘: ‘last_name‘, ‘bd‘: ‘birth_date‘, ‘pk‘: ‘id‘}
    Person.objects.raw(‘SELECT * FROM some_other_table‘, translations=name_map)

    # 指定数据库
    models.UserInfo.objects.raw(‘select * from userinfo‘, using="default")

    ################### 原生SQL ###################
    from django.db import connection, connections
    cursor = connection.cursor()  # cursor = connections[‘default‘].cursor()
    cursor.execute("""SELECT * from auth_user where id = %s""", [1])
    row = cursor.fetchone() # fetchall()/fetchmany(..)


def values(self, *fields):
    # 获取每行数据为字典格式

def values_list(self, *fields, **kwargs):
    # 获取每行数据为元祖

def dates(self, field_name, kind, order=‘ASC‘):
    # 根据时间进行某一部分进行去重查找并截取指定内容
    # kind只能是："year"（年）, "month"（年-月）, "day"（年-月-日）
    # order只能是："ASC"  "DESC"
    # 并获取转换后的时间
        - year : 年-01-01
        - month: 年-月-01
        - day  : 年-月-日

    models.DatePlus.objects.dates(‘ctime‘,‘day‘,‘DESC‘)

def datetimes(self, field_name, kind, order=‘ASC‘, tzinfo=None):
    # 根据时间进行某一部分进行去重查找并截取指定内容，将时间转换为指定时区时间
    # kind只能是 "year", "month", "day", "hour", "minute", "second"
    # order只能是："ASC"  "DESC"
    # tzinfo时区对象
    models.DDD.objects.datetimes(‘ctime‘,‘hour‘,tzinfo=pytz.UTC)
    models.DDD.objects.datetimes(‘ctime‘,‘hour‘,tzinfo=pytz.timezone(‘Asia/Shanghai‘))

    """
    pip3 install pytz
    import pytz
    pytz.all_timezones
    pytz.timezone(‘Asia/Shanghai’)
    """

def none(self):
    # 空QuerySet对象


####################################
# METHODS THAT DO DATABASE QUERIES #
####################################

def aggregate(self, *args, **kwargs):
   # 聚合函数，获取字典类型聚合结果
   from django.db.models import Count, Avg, Max, Min, Sum
   result = models.UserInfo.objects.aggregate(k=Count(‘u_id‘, distinct=True), n=Count(‘nid‘))
   ===> {‘k‘: 3, ‘n‘: 4}

def count(self):
   # 获取个数

def get(self, *args, **kwargs):
   # 获取单个对象

def create(self, **kwargs):
   # 创建对象

def bulk_create(self, objs, batch_size=None):
    # 批量插入
    # batch_size表示一次插入的个数
    objs = [
        models.DDD(name=‘r11‘),
        models.DDD(name=‘r22‘)
    ]
    models.DDD.objects.bulk_create(objs, 10)

def get_or_create(self, defaults=None, **kwargs):
    # 如果存在，则获取，否则，创建
    # defaults 指定创建时，其他字段的值
    obj, created = models.UserInfo.objects.get_or_create(username=‘root1‘, defaults={‘email‘: ‘1111111‘,‘u_id‘: 2, ‘t_id‘: 2})

def update_or_create(self, defaults=None, **kwargs):
    # 如果存在，则更新，否则，创建
    # defaults 指定创建时或更新时的其他字段
    obj, created = models.UserInfo.objects.update_or_create(username=‘root1‘, defaults={‘email‘: ‘1111111‘,‘u_id‘: 2, ‘t_id‘: 1})

def first(self):
   # 获取第一个

def last(self):
   # 获取最后一个

def in_bulk(self, id_list=None):
   # 根据主键ID进行查找
   id_list = [11,21,31]
   models.DDD.objects.in_bulk(id_list)

def delete(self):
   # 删除

def update(self, **kwargs):
    # 更新

def exists(self):
   # 是否有结果

方法大全


举几个例子：
# only:将指定的字段查询加载出来，后续再访问指定的字段就不需要再查询数据库
ret = Book.objects.all().only(‘title‘)  # 拿到所有书的对象列表
for i in ret:
    print(i.title)  # 访问指定的字段title不需要再去查询数据库

for i in ret:
    print(i.price)  # 访问不是指定的字段，每一次都去查一次数据库



# defer:将除了指定的字段查询加载出来，后续再访问指定的字段就不需要再查询数据库(only的反义词)
ret = Book.objects.all().defer(‘title‘)
for i in ret:
    print(i.title)  # 访问指定的字段title，每一次都需要去查询数据库

for i in ret:
    print(i.price)  # 访问不是指定的字段，不需要再查询数据库


# bulk_create：一次SQL语句批量创建
from datetime import date
obj = (Publisher(name=‘第%s出版社‘ %(i), addr=‘中国‘, date=date.today()) for i in range(100))
Publisher.objects.bulk_create(obj)


# select_related：把id=2的书的信息和它关联的出版社的信息一起查询出来。
ret = Book.objects.filter(id=2).select_related(‘publisher‘)
print(ret[0].publisher.name)

以上是关于ORM之基础操作进阶的主要内容，如果未能解决你的问题，请参考以下文章