mysql学习笔记
Posted 每天告诉自己要努力
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mysql学习笔记相关的知识,希望对你有一定的参考价值。
英语单词都认识的话,mysql的基本使用方法不难。难的地方在于应用场景和设计思路以及优化方案。
1、sql、DB、DBMS分别是什么,他们之间的关系?
DB: database 数据库,实际上是以文件的方式存储在硬盘中;
DBMS:database management system数据库管理系统,我们常说的mysql数据库其实不太准确,准确来说mysql属于一种数据库管理系统;
SQL:称成为sql语句,结构化查询语言,是一门高级语言,同样需要先编译再执行。标准sql适用于所有的数据库产品,
DBMS负责执行sql语句,通过执行sql语句来操作DB当中的数据。
2、表——table
table是数据库的基本组成单元,所有的数据都以表格的形式组织,目的是可读性强。
一个表包括行和列,行被称为数据,列被称为字段,字段包括(字段名、数据类型、约束)。比如平常的表格中,我们理解的第一行就是mysql里面的列,举个例子:
“班级(char) 姓名(varchar) 学号(int)”
“小小班 王二狗 123 ”
班级、姓名、学号是字段名(列),char、varchar、int是数据类型。而小小班、王二狗、123是数据(行)。
3、mysql分为:
DQL(数据查询语言): 查询语句,凡是select语句都是DQL。
DML(数据操作语言):insert delete update,对表当中的数据进行增删改。
DDL(数据定义语言):create drop alter,对表结构的增删改。
TCL(事务控制语言):commit提交事务,rollback回滚事务。(TCL中的T是Transaction)
DCL(数据控制语言): grant授权、revoke撤销权限等。
4、一条完整的DQL语句:
select——5
from——1
where——2
group by——3
having——4
order by ——6
limit————7
注意,分组函数必须在分组之后才可以使用:sum、avg、max、min
sql的设计者用的是英语的逻辑,dql语句的执行顺序比较像倒装句。
从(from)哪里(where)来,按分组(group by)有什么条件(having),挑出来(select),最后排序(order by)……
5、查询结果去重
distinct,必须用在所有字段的最前面:select distinct 姓名,班级 from 花名册;
6、连接查询:
在实际开发中,大部分的情况下都不是从单表中查询数据,一般都是多张表联合查询取出最终的结果。一般一个业务都会对应多张表,比如:学生和班级,起码两张表。
根据表的连接方式来划分:
内连接:等值连接、非等值连接、自连接
外连接:左外连接(左连接)、右外连接(右连接)
全连接:由于MySQL没有 FULL JOIN ON 经过查资料发现可以通过左连接+union+右连接实现全连接方案
在表的连接查询方面有一种现象被称为:笛卡尔积现象。(笛卡尔乘积现象),如果不加以约束,则表的总条数等于n个表的条数的积。加条件过滤可以避免笛卡尔积现象,但是不会减少记录的匹配次数,只是显示的是过滤后的有效记录。
7、内连接与外连接
什么是外连接,和内连接有什么区别?
内连接:
假设A和B表进行连接,使用内连接的话,凡是A表和B表能够匹配上的记录查询出来,这就是内连接。
AB两张表没有主副之分,两张表是平等的。
外连接:
假设A和B表进行连接,使用外连接的话,AB两张表中有一张表是主表,一张表是副表,主要查询主表中
的数据,捎带着查询副表,当副表中的数据没有和主表中的数据匹配上,副表自动模拟出NULL与之匹配。
外连接的分类?
左外连接(左连接):表示左边的这张表是主表。
右外连接(右连接):表示右边的这张表是主表。
左连接有右连接的写法,右连接也会有对应的左连接的写法。
8、子查询,多表连接
嵌套select语句;把一条语句查询出来的数据当作一张新表,再跟别的表连接操作:
(seltct 学号 姓名 from 花名册)t;
这个语句就是虚拟出一张t表可以继续操作t
9、limit(常用在分页查询)
limit是mysql特有的,其他数据库中没有,不通用。作用是可以取出一堆数据里面的部分数据。
limit startIndex, length
startIndex表示起始位置,从0开始,0表示第一条数据。
length表示取几个(类似于string的截取)或者直接填一个数字代表从0开始的多少个数据;
10、通用的标准分页sql?
每页显示3条记录:
第1页:0, 3
第2页:3, 3
第3页:6, 3
第4页:9, 3
第5页:12, 3
每页显示pageSize条记录: 第pageNo页:(pageNo - 1) * pageSize, pageSize
pageSize是每页显示多少条记录 pageNo是显示第几页
11、创建表
create table 表名(字段名1 数据类型,……);
数据类型:int、bigint(long)、float(float&double)、char(定长)、varchar(string)、data(日期类型)、BLOB(binary large object 二进制大文件、图片、视频流)、CLOB(大字符串)
char和varchar怎么选择?
在实际的开发中,当某个字段中的数据长度不发生改变的时候,是定长的,例如:性别、生日等都是采用char。
当一个字段的数据长度不确定,例如:简介、姓名等都是采用varchar。
12、增 insert
语法格式:
insert into 表名(字段名1,字段名2,字段名3,…) values(值1,值2,值3,…)
要求:字段的数量和值的数量相同,并且数据类型要对应相同。字段名可以省略不写,但是后面的value对数量和顺序都要按顺序来。
当一条insert语句执行成功之后,表格当中必然会多一行记录。
即使多的这一行记录当中某些字段是NULL,后期也没有办法执行
insert语句插入数据了,只能使用update进行更新。
13、改 update
语法格式: update 表名 set 字段名1=值1,字段名2=值2… where 条件;
注意:没有条件整张表数据全部更新。
14、删 delete
语法格式: delete from 表名 where 条件;
注意:没有条件全部删除。
如果数据量大的话 delete会比较慢,可以用truncate
truncate tablle 表名; 意思是表被截断,永久丢失。
delete相当于橡皮擦把纸上的内容擦掉,还可能根据留下的模糊痕迹找回内容。而truncate等于把纸上有内容的地方用剪刀剪掉。
15、约束
(重要的事情说三遍)在创建表的时候,在创建表的时候,在创建表的时候,可以给表的字段添加相应的约束,添加约束的目的是为了保证表中数据的合法性、有效性、完整性。
唯一约束(unique):约束的字段不能重复
主键约束(primary key):约束的字段既不能为NULL,也不能重复(简称PK)
外键约束(foreign key):根据PK去索引主表(简称FK)
检查约束(check):注意Oracle数据库有check约束,但是mysql没有,目前mysql不支持该约束。
主键有什么作用?
根据主键字段的字段数量来划分:
1. 单一主键 (推荐的,常用的。)
2.复合主键(多个字段联合起来添加一个主键约束) (复合主键不建议使用,因为复合主键违背三范式。)
根据主键性质来划分:
1.自然主键 :主键值最好就是一个和业务没有任何关系的自然数。(这种方式是推荐的)
2. 业务主键 : 主键值和系统的业务挂钩,例如:拿着银行卡的卡号做主键、拿着身份证号做为主键。(不推荐使用)
最好不要拿着和业务挂钩的字段做为主键。因为以后的业务一旦发生改变的时候,主键也可能需要随着
发生变化,但有的时候没有办法变化,因为变化可能会导致主键重复。
* 一张表的主键约束只能有1个。(必须记住)
mysql提供主键值自增mid字段自动维护一个自增的数字,从1开始,以1递增:auto_increment
外键约束
关于外键约束的相关术语:
外键约束:foreign key
外键字段:添加有外键约束的字段
外键值:外键字段中的每一个值。外键值可以为NULL
外键字段引用其他表的某个字段的时候,被引用的字段必须是主键吗?
注意:被引用的字段不一定是主键,但至少是具有unique约束,具有唯一性,不可重复!
16、存储引擎
存储引擎相当于在mysql表中的一种不同的组织方式:
- 比如像MyISAM,采用三个文件组织一个表(frm存格式,MYD存数据,MYI存索引),优点可以压缩转换成只读表,压缩节省空间,提高检测效率,但是这种方式不支持事务。
- 还有一种叫innodb的,是mysql默认的存储引擎,支持事务,支持级联删除、级联更新。而且可以在mysql数据库崩了之后提供自动恢复机制,innodb存储引擎可以保障数据安全。表的结构存储在frm文件中, 数据存储在tablespace这样的表空间中(逻辑概念),无法被压缩,无法转换成只读。
- 还有一种存储在内存中的叫memory,查询速度非常快,但是数据容易丢失。不支持事务。
17、事务
**(只跟DML语句有关:insert delete update)**因为这三个语句都是和数据库表当中的"数据"相关的。
一个事务是一个完整的业务逻辑单元,不可再分。事务的存在是为了保证数据的完整性,安全性。想要保证以上的两条DML语句同时成功或者同时失败,那么就要使用数据库的"事务机制"。
事务包括四大特性:ACID
A:原子性:事务是最小的工作单元,不可再分。
B:一致性:事务必须保证多条DML语句同时成功或者同时失败。
C:隔离性:事务A与事务B之间具有隔离。
D:持久性:持久性说的是最终数据必须持久化到硬盘中,事务才算成功结束。
18、事务之间的隔离性
事务隔离性存在隔离级别,理论上隔离级别包括4个
第一级别:读未提交(read uncommitted)
对方事务还没有提交,我们当前事务可以读取到对方未提交的数据。
读未提交存在脏读(Dirty Read) 现象:表示读到了脏数据。第二级别:读已提交(read committed)
对方事务提交之后的数据我方可以读取到。
读已提交存在的问题是:不可重复读。第三级别:可重复读(repeatable read)
这种隔离级别解决了:不可重复读问题。
这种隔离级别存在的问题是:读取到的数据是幻象。第四级别:序列化读/串行化读
解决了所有问题。
效率低,需要事务排队。Oracle数据库默认的隔离级别是:第二级别,读已提交。
mysql数据库默认的隔离级别是:第三级别,可重复读。
mysql事务默认情况下是自动提交的。
只要执行任意一条DML语句则提交一次
关闭默认提交: start transaction;
rollback : 回滚(只擦掉数据)。
commit : 提交(擦掉数据并且写入硬盘)。
start transaction : 关闭自动提交机制。
19、索引
索引就相当于一本书的目录,通过目录可以快速的找到对应的资源。
在数据库方面,查询一张表的时候有两种检索方式:
第一种方式:全表扫描
第二种方式:根据索引检索(效率很高)
索引为什么可以提高检索效率呢?
其实最根本的原理是缩小了扫描的范围。
索引虽然可以提高检索效率,但是不能随意的添加索引,因为索引也是数据库当中的对象,也需要数据库不断的维护。是有维护成本的。
比如:表中的数据经常被修改,这样就不适合添加索引,因为数据一旦修改,索引需要重新排序,进行维护。
创建索引的时候,原来的每条数据都会绑定一个物理地址,当创建索引的时候,会复制生成一个索引表,并且用B树的方式去排序、分区,然后这张索引表上会有排好序的数据和他的物理地址,当索引表中的数据被找到的时候,会直接查找绑定的物理地址直接找到真实表中的数据。
select 姓名 from 花名册; ———> select 姓名 from 0x123;
什么时候考虑给字段添加索引?(满足什么条件)
* 数据量庞大。(根据客户的需求,根据线上的环境)
* 该字段很少的DML操作。(因为字段进行修改操作,索引也需要维护)
* 该字段经常出现在where子句中。(经常根据哪个字段维护)
注意:
-
主键具有unique约束的字段会自动添加索引。
-
根据主键查询效率较高,尽量根据主键检索。
-
模糊查询的时候,第一个通配符使用的是%,这个时候索引是是失效的。
20、视图
- 只有DQL语句才能以视图对象的方式创建出来。
- 站在不同的角度去看到数据。(同一张表的数据,通过不同的角度去看待)
- 对视图进行增删改查,会影响到原表数据。(通过视图影响原表数据,不是直接操作的原表)
- 试图可以隐藏表的实现细节。保密级别较高的系统,数据库只对外提供相关的视图,开发中只对视图对象进行CRUD。
**
21、数据的三范式(重点)
**
三范式是设计表的依据。按照这三个范式设计的表不会出现数据冗余。但是在实际的开发中,以满足客户需求为主,有的时候会拿冗余换执行速度。
- 第一范式:任何一张表都应该有主键,并且每一个字段原子性不可再分。
- 第二范式:建立在第一范式的基础上,所有非主键字段完全依赖主键,不能产生部份依赖。(多对多?三张表,关系表两个外键。)
- 第三范式:建立在第二范式的基础上,所有非主键字段直接依赖主键,不能产生传递依赖。(一对多?两张表,多的表加外键。)
以上是关于mysql学习笔记的主要内容,如果未能解决你的问题,请参考以下文章