索引就是通过特殊的数据结构将数据组织在一起，这样查询时就不需要通过一行行遍历去找目标数据，此时的时间复杂度仍是 O(n) ，数据量少的时候没问题，但是一旦数据量太大，就会造成开销太大；我们这里的 O(n) 每一次都要读取硬盘，它的速率会比读取内存中的数据更慢；所以我们迫切的需要索引来减低访问磁盘的次数。

虽然索引增加了查询的速率，但是减低了增上改的效率，并且增加了更多的内存消耗。

索引的使用：

在 mysql 代码中语法很简单：

创建索引：
create index 索引名 on 表名(字段名);
查看索引：

show index from 表名;

删除索引：

drop index 索引名 on 表名;

要考虑对数据库表的某列或某几列创建索引，需要考虑以下几点：

数据量较大，且经常对这些列进行条件查询。
该数据库表的插入操作，及对这些列的修改操作频率较低。
索引会占用额外的磁盘空间。

当面对数据量大时去创建一个索引，系统为了创建这个索引而消耗过多的资源，导致机器无法正常工作；所以，索引在实际开发中并不会频繁使用。

对于索引的使用不是我们想要讨论的课题，我们学习索引更主要的是想了解索引底层的数据结构。

索引实现的数据结构

我们知道索引主要是增加查询效率的，我们之前学过两个主要用于查询的数据结构。

一个是二叉搜索树，一个是哈希表

那么索引是什么呢？

先来知道为什么二叉搜索数和哈希表不能用来创建索引：

二叉搜索树：二叉搜索树在极端情况（单分支）下树的高度非常的高，那么此时的查询速率就非常低效
哈希表：哈希表的实现原理是计算哈希值用来存放数据，而对于相邻的数据之前是无法比较的

那么我们在二叉搜索树的基础上就提出了B树；

而B+ 树又是建立在B树的基础上，B树又叫 B - 树（不是B减树，是B 杠树），是为索引量身定制的数据结构。

我们来简单认识一下B树和B+树。

B树

B树是棵N叉搜索树，每个节点具有多个key值，如图：

有 n 个 key 就将其分为 n + 1 个子节点，每个分组如下图：

当节点中的子树多，节点上保存的key就多，意味着同样key的个数的前提下B树的高度要远低于二叉搜索树；

树的高度越高，进行查询的时候，磁盘访问次数就越多！！！

B+ 树

B+ 又在B树的基础上作出改进（树也是个N叉搜索树）：

画图演示：

这样同样一棵树我们却只分为了 3 个域：

我们划分出的三个域不仅存了规定的值，并且还保留了关键的 key 。

这里的 50 是整个树中最大的值，该树中不可能出现大于50 的值。

我们再划分一次：

划分结束后类似于链表一样将其链接起来，这样整棵树的叶子节点包含了所有的数据，所有非叶子节点的 key 都出现在了叶子节点中。

这种‘链表’就是mysql组织数据的形式，当你看到一张表的时候，
实际上这个表不一定就是按照‘表格’这样的数据结构在硬盘上组织的，也有可以是按照这种书的结构组织的；（具体是那种哪种结构，取决于你表中的索引，以及数据库使用了哪种存储引擎）

B+ 树的特点

每个节点可以存在 n 个 key ，n 个 key 划分出 n 个子节点（B树的特点是划分出 n + 1 个子节点）。
每个 key 都会出现在叶子节点中，同时也是叶子节点中的最大值。
B+ 树的叶子节点是首尾相连的，类似于一个链表
由于叶子节点是个完整的数据集合，只在叶子节点中存储数据表中每一行的数据，而非叶子节点只存 key 本身即可。

具体解释以下第四点：

我们设 id 为索引，那我们存储的值就是 id，在存数据时，不会将整个集合中的数据都存入，只存入一个id，其余的仍然保存在硬盘中，有需要的时候在去硬盘中取；为什么要怎么设计呢？因为内存空间是有序的：

B+ 树的优势

每个节点存储多个 key ，最终会使树相对较矮，这样在查询的时候就减少了IO（输入输出）访问次数（这里IO特指的是硬盘的访问）
最后所有的查询都会落到叶子节点上，这样无论查询多少次都可以保证查询效率是同样的，保证了稳定性；（稳定性对于程序员对这个树的评估更加准确）
B+ 树的所有叶子节点构成链表，因此方便了进行范围查询（比如查询学生 id 在27 ~ 36之前的就非常快）
由于数据都存在叶子节点上，非叶子节点只存在key，导致非叶子节点所占的内存是非常小的，这些非叶子节点就可以在内存缓存或者是内存换中的一部分，这样就进一步减少了IO访问！

至于B 树和B+ 树的代码就放在数据结构进阶的部分再继续！！！

事物

事物的概念

事务指逻辑上的一组操作，组成这组操作的各个单元，要么全部成功，要么全部失败。
在不同的环境中，都可以有事务。对应在数据库中，就是数据库事务。

为什么要有事物这个概念

在很多年前，那个时候还没有微信转账，主要是靠银行卡之间进行转账，有时候会发生很多问题，比如：转账以后，另一方没有收到！！！

又比如，现在网传，台湾那边充话费需要半个小时才能到账！

有了事物，我们这一组操作，要么一起成功，要么一起失败。大大的提高了效率；

事物存在的意义就是将多个sql语句打成一个包，要么包内全部执行成功，要么包内全部执行不成功，不存在中间状态！

事物的使用

sql执行过程：

开启事务：start transaction;
执行多条SQL语句
回滚或提交：rollback/commit;

说明：rollback即是全部失败，commit即是全部成功。

举例 :

jerry 的账户原来有10000元，而tom 只有5000元，jerry 给 tom 转账 1000后的结果：

如果执行失败，并非是没有执行，而是执行以后将数据恢复未执行之前的状态，这个恢复的过程称之为 " 回滚 " （rollback）

例如上面这个例子，再jerry 转账过后系统崩了，但是钱却扣了；在下次重新启动系统后，就会把钱加回来！

进行回滚的时候咋知道恢复成什么样子呢？数据库中有个专门来记录事物的日志。

因此，使用事物的时候，执行sql语句开销是非常大的。

事物使用起来非常简单，但是理解起来有些难！

事物的四大特性

数据库的事物有四大关键特性（这也是面试中经常问的【八股文】）

原子性（事务中的每个sql语句都是最小的，不可再分的）
一致性（事物执行前后都是靠谱的）
持久性（事物执行的内容是存在硬盘上的，即使机器重启也不会丢失，因此数据是可持久的）
隔离性（为了解决“并发”执行事物，引起的问题）

隔离性这里重点讲解以下：

先来讲讲啥叫并发：

并发就是一个服务器为多个客户端提供服务；

如果并发是操作不同的数据，那么并发并不会造成影响，但是它并非都是操作不同数据，存在操作同一数据的情况。

例如上面的案例，假设多个用户对一个账号进行转账操作，那就会把数据搞乱。

事物的隔离性就体现在即使是并发事物操作也不会引发问题！

既然聊到并发，那就来聊聊并发可能引起的问题

并发可能引起的问题

脏读问题

什么叫脏读？

举个贴切的例子：

有一场考试中，隔壁的想抄我的答案，我故意给他看，但是后面我又将答案给改了，那么他看到的数据就是一个 “脏数据”。脏也就是无效的意思。

那么这么解决脏读的问题呢?

很简单，我们在写数据的时候给它进行加锁，mysql引入一个 “写操作加锁” 机制。加锁是会提高耗能的，同时降低了效率，也增加了隔离性。

也就是说我考试的时候不给隔壁的人看。

不可重复读

举例：

还是那一场考试，我们约定好，我写完了给他抄，不故意坑他；在我第一次写完以后（version 1）给他抄了，在抄的过程中我发现自己写错了已一道题，我就又改了（version 2）这个时候他读着读着发现数据不一样了。

这个问题就是不可重复读。

事物1 提交了数据，事物2 开始读取，事物3 又去更新了数据，此时意味着事物在多次读取数据的结果是不一样的（预期应该是一样的）这就是不可重复读。

解决方法呢也是和上面一样加锁，此时给事物 “ 读 ” 加锁 此时又进一步增加了耗能的，同时降低了效率，也进一步增加了隔离性。

幻读

说明：事物A 读取了一次事物B 对数据进行新增或者删除并提交事物导致读取数据列表数据多了；此时就叫做幻读。

数据库使用 “ 串行化 ” 的方式来解决此类问题，并且彻底放弃并发处理事务，改用串行的方式一行行处理事物；此时的并发程度是最低的，效率也就最低，但是隔离性确是最高的。

针对上述问题又提出了事物的隔离级别

事物的隔离级别

选用哪种级别，这时mysql内置的机制，可以通过修改mysql配置文件，来设置mysql工作环境。

具体如何使用以及其代码在后面会写道。

Mysql 索引事物

索引

针对庞大数据加速查询缺点占用空间
分类:

普通索引: 通过 index 创建

唯一索引: 就是 unique key

主键索引: 就是 primary key

联合索引(多列)":

? 联合普通索引

? 联合唯一索引

? 联合主键索引

创建普通索引

表存在时

create index ix_name on user(name);  创建
create index 索引名 on 表名(列名);  创建

创建表示

在表中  使用
index  索引名(列名)  穿件索引

联合普通索引

create index 索引名 on userinfo(name,email);
最左前缀  name 查询快   email 不适用于 索引

索引注意事项

避免使用 select *
count(1) 或 (列) 代替 count(*)
创建表时尽量使用 char() 代替 varchar()
字段顺序固定长度的字段优先
组合索引代替多个单列索引(经常使用多条件时)
尽量使用短索引
使用连接 join 代替子查询
连表时类型须一致
索引散列(重复少) 不适用于穿件索引例如: 性别

数据库中加锁:

行内锁

开始事物

begin;

加锁

select * from 表名 where id=1 for update;

结束事物

commit;

以上是关于MySQL：索引与事物的主要内容，如果未能解决你的问题，请参考以下文章

MySQL索引事物

Mysql 索引事物

Mysql索引(简单了解)

MySQL数据库 : 自关联,视图,事物,索引

MySQL------MySQL 索引事务与存储引擎

Linux--MySQL 索引事务与存储引擎

MySQL：索引与事物

简单了解索引的底层数据结构

索引的概念：

索引存在的意义：

索引的使用：

索引实现的数据结构

B树

B+ 树

B+ 树的特点

B+ 树的优势

事物

事物的概念

事物的使用

事物的四大特性

并发可能引起的问题

脏读问题

不可重复读

幻读

事物的隔离级别

Mysql 索引 事物

索引

创建普通索引

联合普通索引

索引注意事项

数据库中加锁:

Mysql 索引事物