MySQL 事务
Posted Java程序员进阶
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySQL 事务相关的知识,希望对你有一定的参考价值。
优质博文:IT-BLOG-CN
一、四大特性
事务可以看作一个整体,里面的内容要么都执行成功,要么都不成功。不可能存在部分执行成功而部分执行不成功的情况。在MySQL
中,常见的存储引擎有InnoDB、Myisam
,Memory
等。其中InnoDB支持事务
transaction,而
Myisam,
Memory等不支持事务。事务用来管理
DDL、
DML、
DCL操作,比如
insert,
update,
delete`语句,默认是自动提交的。
DDL(Data Definition Languages)语句:数据定义语言,这些语句定义了不同的数据段、数据库、表、列、索引等数据库对象的定义。常用的语句关键字主要包括
create
、drop
、alter
等。
DML(Data Manipulation Language)语句:数据操纵语句,用于添加、删除、更新和查询数据库记录,并检查数据完整性,常用的语句关键字主要包括insert
、delete
、udpate
和select
等。(增添改查)
DCL(Data Control Language)语句:数据控制语句,用于控制不同数据段直接的许可和访问级别的语句。这些语句定义了数据库、表、字段、用户的访问权限和安全级别。主要的语句关键字包括grant
、revoke
等。
事务的四个特性(ACID):
【1】原子性Atomicity
: 指事务是一个不可分割的最小工作单位,事务中的操作只有都发生和都不发生两种情况。
实现原理: undo log 实现原子性的关键,是当事务回滚时能够撤销所有已经成功执行的sql
语句。InnoDB
实现回滚,靠的是undo log
:当事务对数据库进行修改时,InnoDB
会生成对应的undo log
;如果事务执行失败或调用了rollback
,导致事务需要回滚,便可以利用undo log
中的信息将数据回滚到修改之前的样子。
undo log
属于逻辑日志,它记录的是sql
执行相关的信息。当发生回滚时,InnoDB
会根据undo log
的内容做与之前相反的工作:对于每个insert
,回滚时会执行delete
;对于每个delete
,回滚时会执行insert
;对于每个update
,回滚时会执行一个相反的update
,把数据改回去。
【2】隔离性Isolation
: 一个事务的执行不能被其他事务干扰,即一个事务内部的操作及使用的数据对并发的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。具体细节可以参考隔离级别。
隔离性追求的是并发情形下事务之间互不干扰。简单起见,我们主要考虑最简单的读操作和写操作(加锁读等特殊读操作会特殊说明),那么隔离性的探讨,主要可以分为两个方面:
(一个事务)写操作对(另一个事务)写操作的影响:锁机制保证隔离性
(一个事务)写操作对(另一个事务)读操作的影响:MVCC保证隔离性
【3】持久性Durability
: 一个事务一旦提交成功,它对数据库中数据的改变将是永久性的,接下来的其他操作或故障不应对其有任何影响。
实现原理: InnoDB
作为MySQL
的存储引擎,数据是存放在磁盘中的,但如果每次读写数据都需要磁盘IO
,效率会很低。为此,InnoDB
提供了缓存Buffer Pool
,Buffer Pool
中包含了磁盘中部分数据页的映射,作为访问数据库的缓冲:当从数据库读取数据时,会首先从Buffer Pool
中读取,如果Buffer Pool
中没有,则从磁盘读取后放入Buffer Pool
;当向数据库写入数据时,会首先写入Buffer Pool
,Buffer Pool
中修改的数据会定期刷新到磁盘中(这一过程称为刷脏)。
Buffer Pool
的使用大大提高了读写数据的效率,但是也带了新的问题:如果MySQL
宕机,而此时Buffer Pool
中修改的数据还没有刷新到磁盘,就会导致数据的丢失,事务的持久性无法保证。
于是,引入redo log来解决这个问题:当数据修改时,除了修改·Buffer Pool·中的数据,还会在redo log
记录这次操作;当事务提交时,会调用fsync
接口对redo log
进行刷盘。如果MySQL
宕机,重启时可以读取redo log
中的数据,对数据库进行恢复。redo log
采用的是WAL(Write-ahead logging,预写式日志)
,所有修改先写入日志,再更新到Buffer Pool
,保证了数据不会因MySQL
宕机而丢失,从而满足了持久性要求。
既然redo log
也需要在事务提交时将日志写入磁盘,为什么它比直接将Buffer Pool
中修改的数据写入磁盘(即刷脏)要快呢?主要有以下两方面的原因:
(1)刷脏是随机IO
,因为每次修改的数据位置随机,但写redo log
是追加操作,属于顺序IO
。
(2)刷脏是以数据页Page
为单位的,MySQL
默认页大小是16KB
,一个Page
上一个小修改都要整页写入;而redo log
中只包含真正需要写入的部分,无效IO
大大减少。
【4】一致性Consistency
: 事务必须使数据库从一个一致状态变换到另外一个一致状态,举一个栗子,李二给王五转账50
元,其事务就是让李二账户上减去50
元,王五账户上加上50
元;一致性是指其他事务看到的情况是要么李二还没有给王五转账的状态,要么王五已经成功接收到李二的50
元转账。而对于李二少了50
元,王五还没加上50
元这个中间状态是不可见的。
可以说,一致性是事务追求的最终目标:前面提到的原子性、持久性和隔离性,都是为了保证数据库状态的一致性。此外,除了数据库层面的保障,一致性的实现也需要应用层面进行保障。
二、事务操作
MySQL
的事务操作主要有以下三种:
【1】开启事务:Start Transaction
: 任何一条DML
语句insert
、update
、delete
执行,标志事务的开启命令:BEGIN
或START TRANSACTION
【2】提交事务:Commit Transaction: 成功的结束,将所有的DML
语句操作历史记录和底层硬盘数据来一次同步命令:COMMIT
【3】回滚事务:Rollback Transaction: 失败的结束,将所有的DML
语句操作历史记录全部清空命令:ROLLBACK
在MySQL
中直接用SET
来改变MySQL
的自动提交模式:默认自动提交
--禁止自动提交
set autocommit=0
--开启自动提交
set autocommit=1
手动提交事务案例
select @@autocommit;
set autocommit=0;
--模拟账户转账
begin;
update account set money = money - 100 where name = \'zzx\';
update account set money = money + 100 where name = \'fj\';
--提交事务
commit;
--如果转账过程中出现问题,则回滚事务
rollback;
三、事务的隔离级别
【1】读未提交Read uncommitted
: 一个事务可以读取另一个未提交事务的数据,最低级别,任何情况都无法保证,会造成脏读。
脏读: 脏读是指一个事务正在访问数据,并且对数据进行了修改,但是这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。
【2】读已提交Read committed
: 一个事务要等另一个事务提交后才能读取数据,可避免脏读的发生,会造成不可重复读。
不可重复读: 在这个事务还没有结束时,另外一个事务也访问了该同一数据。那么,在第一个事务中的两次读数据之间,由于第二个事务的修改,那么第一个事务两次读到的的数据可能是不一样的。这样在一个事务内两次读到的数据是不一样的,因此称为是不可重复读。
【3】可重复读Repeatable read
: 就是在开始读取数据(事务开启)时,不再允许修改操作,可避免脏读、不可重复读的发生,但是会造成幻读。
幻读: 当事务不是独立执行时发生的一种现象,例如第一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,第二个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。那么,以后就会发生操作第一个事务的用户发现表中还有没有修改的数据行,就好象发生了幻觉一样。
【4】串行Serializable
: 是最高的事务隔离级别,在该级别下,事务串行化顺序执行,可以避免脏读、不可重复读与幻读。但是这种事务隔离级别效率低下,比较耗数据库性能,一般不使用。
Mysql
的默认隔离级别是Repeatable read
-- 查看隔离级别
show variables like \'%isolation%’;
-- 设置隔离级别
/*
set session transaction isolation level 级别字符串
级别字符串:read uncommitted、read committed、repeatable read、serializable
*/
-- 设置read uncommitted
set session transaction isolation level read uncommitted;
-- 设置read committed
set session transaction isolation level read committed;
-- 设置repeatable read
set session transaction isolation level repeatable read;
-- 设置serializable
set session transaction isolation level serializable;
MySQL索引事务及存储引擎
MySQL索引
索引的概念
- 索引是一个排序列表,在这个表中存储着索引的值和包含这个值的数据所在行的物理地址
- 使用索引可能不用扫描全表来定位某行的数据 ,而是通过索引找到该行数据对应的物理地址来访问对应的数据,加快数据库的查询速度
- 索引相当于一本书的目录,通过目录快速找到所需要的内容
- 索引是表中一列或者若干列值排序的方法
- 建立索引的目的是加快对表中记录的查找或排序
索引的作用
- 设置合适索引后,数据库利用各种快速定位技术,大大加快查询速度,这是创建索引的最主要原因
- 当表很大或涉及到查询多个表时,使用索引可以成千上万倍的提高查询速度
- 可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本
- 通过创建唯一性索引,可以保证数据表中每一行数据的唯一性
- 可以加快表与表之间的连接
- 在使用分组和排序时,可大大减少分组和排序的时间
索引的副作用
- 索引需要占用额外的磁盘空间
- 对于MyISAM引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址而InnoDB引擎的表数据文件本身就是索引文件
- 在插入和修改数据时需要花费更多的时间,加为索引也需要修改
创建索引的原则依据
索引虽可以提升数据库的查询速度,但并不是任何情况下都适合创建索引。加为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。
- 表的主键、外键必须有索引,加为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位
- 记录数超过300行的表应该有索引,如果没有索引,每次查询都会把表遍历一遍,严重影响数据库的性能
- 经常与其他表进行连接的表,应该在连接字段上建立索引
- 唯一性太差的字段不适合建立索引
- 更新太 频繁的字段不适合建立索引
- 经常出现在where子句中的字段特别是大表的字段,应该建立索引
- 在经常进行group by,order by 的字段上建立索引
- 索引应该建立在选择性高的字段上
- 索引应建立在小字段上,对于大的文本字段甚至超长字段,不要建立索引
索引的分类和创建
- 创建一个member表
create table member (id int(10),name varchar(10),cardid int(18),phone int(11),address varchar(50),remark text);
普通索引(最基本的索引)
- 直接创建索引
create index 索引名 on 表名 (列名);
create index id_index on member (id);
#列名即指定字段名
索引名以“_index”结尾
- 修改表方式创建索引
alter table 表名 add index 索引名 (指定字段)
- 创建表时直接创建索引
create table member1 (id int(10),name varchar(10),cardid int(18),phone int(11),address varchar(50),remark text,index id_index(id));
唯一索引
- 与普通索引类似,但区别是唯一索引列的每个值都唯一。唯一索引允许有空值。如果使用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引
- 直接创建唯一索引
create unique index id_index on member (id);
- 修改表方式创建
alter table member add unique name_index (name);
- 创建表时指定
create table member2 (id int(10),name varchar(10),cardid int(18),phone int(11),address varchar(50),remark text,unique id_index(id));
主键索引
- 是一种特殊索引,必须指定 primary key ,一个表只能有一个主键,不允许有空值,添加主键将自动创建主键索引
- 修改表方式创建
alter table member add primary key (id);
- 创建表时指定
create table member2 (id int(10),name varchar(10),cardid int(18),phone int(11),address varchar(50),remark text,primary key (id));
或者:
create table member3 (id int(10),name varchar(10) primary key,cardid int(18),phone int(11),address varchar(50),remark text);
组合索引
- 组合索引符合最左原则,从左往右依次执行,前后顺序应对应,如果顺序不一致,索引将不会生效
select * from 表名 where 列名1='' adn 列名2='';
create table (列名1 数据类型,列名2 数据类型,index 索引名 (列名1,列名2));
全文索引
- 全文索引适合模糊查询时使用。在MySQL5.6版本前fulltext索引仅可用于myisam,在5.6版本后innodb引擎也支持fulltext索引。全文索引可以在char,varchar,或者text类型的列上创建,每个表只允许有一个全文索引。
- 直接创建索引
create fulltext index 索引名 on 表名 (指定创建索引的字段);
#指定创建索引的字段类型只能是char/varchar/text类型
- 修改表方式创建索引
alter table 表名 add fulltext 索引名(列名)
- 创建表时指定索引
create table 表名 (字段1,数据类型..,fulltext 索引名(指定字段));
- 使用全文索引查询
select * from class where match(remark) against('vip');
删除索引
- 直接删除索引
drop index 索引名 on 表名;
- 修改表方式删除索引
alter table 表名 drop index 索引名;
- 删除主键索引
alter table 表名 drop primary key;
MySQL事务
概念
- 事务是一种机制、一个操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撤销操作请求,即这一组数据库命令要么都执行,要么都不执行
- 事务是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元
- 事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等
- 事务是通过事务的整体性以保证数据的一致性
- PS:说白了,所谓事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位
事务的ACID特点
ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应该具有的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。这是可靠数据库所应具备的几个特性
- 原子性:指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生
事务是一个完整的操作,事务的各元素是不可分的
事务中的所有元素必须作为一个整体提交或回滚
如果事务中的任何元素失败,则整个事务将失败 - 一致性:指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏
当事务完成时,数据必须处于一致状态
在事务开始前,数据库中存储的数据处于一致状态
在正在进行的事务中,数据可能处于不一致的状态
当事务成功完成时,数据必须再次回到已知的一致状态 - 隔离性:指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间
对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务
修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据 - 持续性:在事务完成以后,该事务所对数据库所作的更改便持久的保存在数据库之中,并不会被回滚
指不管系统是否发生故障,事务处理的结果都是永久的
一旦事务被提交,事务的效果会被永久地保留在数据库中
事务之间的相互影响
- 脏读
一个事务读取了另一个事务未提交的数据,而这个数据是有可能回滚的 - 不可重复读
一个事务内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的 - 幻读
一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,另一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。那么,操作前一个事务的用户会发现表中还有没有修改的数据行,就好象发生了幻觉一样 - 丢失更新
两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果
MySQL及事物隔离级别
- read uncommitted: 读取尚未提交的数据 :不解决脏读
- read committed:读取已经提交的数据 :可以解决脏读
- repeatable read:重读读取:可以解决脏读 和 不可重复读 —mysql默认的
- serializable:串行化:可以解决 脏读 不可重复读 和 虚读—相当于锁表
- mysql默认的事务处理级别是 repeatable read ,而Oracle和SQL Server是 read committed
查询全局事务隔离级别
show global variables like '%isolation%';
或者
select @@global.tx_isolation;
查询会话事务隔离级别
show session variables like '%isolation%';
SELECT @@session.tx_isolation;
SELECT @@tx_isolation;
设置全局事务隔离级别
- 参照上面事物隔离级别!
set global transaction isolation level read committed;
设置会话事务隔离级别
set session transaction isolation level read committed;
事务控制语句
- begin或 start transaction:显式地开启一个事务
commit 或 commit work:提交事务,并使已对数据库进行的所有修改变为永久性的 - rollback 或 rollback work:回滚会结束用户的事务,并撤销正在进行的所有未提交的修改
- SAVEPOINT S1:使用 SAVEPOINT 允许在事务中创建一个回滚点,一个事务中可以有多个 SAVEPOINT;“S1”代表回滚点名称
- ROLLBACK TO [SAVEPOINT] S1:把事务回滚到标记点
案例应用
create database school;
use school;
create table class(
id int(10) primary key not null,
name varchar(10),
money double
);
insert into class values(1,'A',1000);
insert into class values(2,'B',1000);
select * from class;
测试提交事务
begin;
update class set money= money - 100 where name='A';
select * from class;
commit;
quit
mysql -u root -p
use school;
select * from class;
测试回滚事务
begin;
update class set money= money + 100 where name='A';
select * from class;
rollback;
quit
mysql -u root -p
use school;
select * from class;
测试多点回滚
begin;
update class set money= money + 100 where name='A';
select * from class;
savepoint s1;
update class set money= money + 100 where name='B';
select * from class;
savepoint s2;
insert into class values(3,'C',1000);
select * from class;
rollback to s1;
select * from class;
使用set设置控制事务
SET AUTOCOMMIT=0; #禁止自动提交
SET AUTOCOMMIT=1; #开启自动提交,Mysql默认为1
SHOW VARIABLES LIKE 'AUTOCOMMIT'; #查看Mysql中的AUTOCOMMIT值
- 如果没有开启自动提交,当前会话连接的mysql的所有操作都会当成一个事务直到你输入rollback|commit;当前事务才算结束
- 当前事务结束前新的mysql连接时无法读取到任何当前会话的操作结果
- 如果开起了自动提交,mysql会把每个sql语句当成一个事务,然后自动的commit
- 无论开启与否,begin 与 commit|rollback都是独立的事务
MySQL存储引擎
MySQL存储引擎介绍
- MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎
- 存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式
MySQL常用的存储引擎
- MyISAM
- InnoDB
MySQL数据库中的组件,负责执行实际的数据I/O操作
MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储
MyISAM
MyISAM特点
- MyISAM不支持事务,也不支持外键约束,只支持全文索引,数据文件和索引文件是分开保存的
- 访问速度快,对事务完整性没有要求
MyISAM 适合查询、插入为主的应用 - MyISAM在磁盘上存储成三个文件,文件名和表名都相同,但是扩展名分别为:
.frm 文件存储表结构的定义
数据文件的扩展名为 .MYD (MYData)
索引文件的扩展名是 .MYI (MYIndex) - 表级锁定形式,数据在更新时锁定整个表
数据库在读写过程中相互阻塞:
会在数据写入的过程阻塞用户数据的读取
也会在数据读取的过程中阻塞用户的数据写入
数据单独写入或读取,速度过程较快且占用资源相对少
MyISAM 表支持 3 种不同的存储格式
- 静态(固定长度)表
静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多 - 动态表
动态表包含可变字段,记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行 OPTIMIZE TABLE 语句或 myisamchk -r 命令来改善性能,并且出现故障的时候恢复相对比较困难 - 压缩表
压缩表由 myisamchk 工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支
MyISAM适用的生产场景
- 公司业务不需要事务的支持
- 单方面读取或写入数据比较多的业务
- MyISAM存储引擎数据读写都比较频繁场景不适合
- 使用读写并发访问相对较低的业务
- 数据修改相对较少的业务
- 对数据业务一致性要求不是非常高的业务
- 服务器硬件资源相对比较差
InnoDB
InnoDB特点
- 支持事务,支持4个事务隔离级别
MySQL从5.5.5版本开始,默认的存储引擎为 InnoDB - 读写阻塞与事务隔离级别相关
能非常高效的缓存索引和数据
表与主键以簇的方式存储
支持分区、表空间,类似oracle数据库
支持外键约束,5.5前不支持全文索引,5.5后支持全文索引 - 对硬件资源要求还是比较高的场合
行级锁定,但是全 表扫描仍然会是表级锁定,如
update table set a=1 where user like ‘%lic%’; - InnoDB 中不保存表的行数,如 select count() from table; 时,InnoDB 需要扫描一遍整个表来计算有多少行,但是 MyISAM 只要简单的读出保存好的行数即可。需要注意的是,当 count()语句包含 where 条件时 MyISAM 也需要扫描整个表
对于自增长的字段,InnoDB 中必须包含只有该字段的索引,但是在 MyISAM 表中可以和其他字段一起建立组合索引
清空整个表时,InnoDB 是一行一行的删除,效率非常慢。MyISAM 则会重建表
查看存储引擎
查看系统支持的存储引擎
show engines;
查看表使用的存储引擎
- 方法一
show table status from 库名 where name='表名'\\G;
- 方法二
use 库名;
show create table 表名;
修改存储引擎
- 方法一
use 库名;
alter table 表名 engine=MyISAM;
- 方法二
quit
vim /etc/my.cnf
[mysqld]
#在mysqld配置文件里面修改
default-storage-engine=INNODB
systemctl restart mysqld.service
- 方法三
use 库名;
create table 表名(字段1 数据类型,...) engine=MyISAM;
以上是关于MySQL 事务的主要内容,如果未能解决你的问题,请参考以下文章