MySQL索引

Posted 2023-03-29 啦哆咪

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了MySQL索引相关的知识，希望对你有一定的参考价值。

mysql索引

简介

索引（index）是帮助MySQL高效获取数据的有序的数据结构。在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式指向数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引。

使用索引的优点主要有：

提高数据检索的效率，降低数据库的IO成本
通过索引列对数据进行排序，降低数据排序的成本，降低CPU的消耗

主要缺点有：

索引列需要占用一定空间。
索引会降低更新表的速度，如对表进行INSERT、UPDATE、DELETE时，效率降低。因为需要维护数据结构。

总之，索引可以理解为用空间换时间的数据结构，对于需要大量查询的表，通常都需要创建索引来提高查询效率。

索引数据结构

B+Tree索引是我们最常用的索引，在没有特殊说明的情况下，索引通常都指B+Tree索引

B-Tree

B-Tree，又叫多路平衡查找树，其中多路指一个节点可以有两个以上的子节点。平衡指的是任意节点的子树的高度差都小于等于1。查找指的是一个节点下的子节点是有序的，通常指左小右大，方便查找。这是一种查找效率比较高的数据结构，具体如下图

可以访问https://www.cs.usfca.edu/~galles/visualization/Algorithms.html来查看B树的操作过程，具体不再过多解释

B+Tree

B+Tree是在B-Tree的基础上做了一定的调整，具体结构图如下

和B-Tree区别如下：

所有的节点会出现在叶子节点
只在叶子节点保存数据，其他节点只作为索引
叶子节点将作为一个单向链表

在MySQL的InnoDB中，对B+Tree进行了一定优化，把叶子作为一个双向的链表，以此提高区间访问的性能，具体如下图

索引分类

根据索引的作用，可以分为如下几种

根据索引的存储结构，还可以分为聚簇索引和二级索引，其中聚集索引的叶子节点存放的是数据，而二级索引的叶子节点存放的是聚集索引的值，一般是主键。

聚集索引选取规则：

如果存在主键，主键索引就是聚集索引。
如果不存在主键，将使用第一个唯一(UNIQUE)索引作为聚集索引。
如果表没有主键，或没有合适的唯一索引，则InnoDB会自动生成一个rowid作为隐藏的聚集索引

从上图可以得知，当使用主键进行查询时，会走聚集索引，直接可以从叶子节点中取到数据。

如果我们通过二级索引去查找数据，则只能拿到数据的id，需要再去使用聚集索引，才能找到真正的数据，这就是回表查询，效率会比使用主键查找慢。

索引语法

创建索引：若创建索引时指定了多列，称为联合索引
```
CREATE [UNIQUE|FULLTEXT] INDEX 索引名 ON 表名 (列名,...);
```
对于文本字段，可以在列名后加(n)来表示为前n个字符创建索引，这样可以节省空间
```
CREATE [UNIQUE|FULLTEXT] INDEX 索引名 ON 表名 (列名(n),...);
```
查看索引：
```
SHOW INDEX FROM 表名;
```
删除索引：
```
DROP INDEX 索引名 ON 表名;
```

mysql索引类型解释

在mysql query browser 里给表的字段建立索引的时候会选择索引类型（index type）分别有btree，hash，rtree 这几个分别是什么意思有什么区别，请高手指教谢谢！

索引分单列索引和组合索引。单列索引，即一个索引只包含单个列，一个表可以有多个单列索引，但这不是组合索引。组合索引，即一个索包含多个列。
MySQL索引类型包括：
(1)普通索引
这是最基本的索引，它没有任何限制。它有以下几种创建方式：
◆创建索引
CREATE INDEX indexName ON mytable(username(length));
如果是 CHAR，VARCHAR类型，length可以小于字段实际长度;如果是BLOB和TEXT类型，必须指定 length，下同。
◆修改表结构
ALTER mytable ADD INDEX [indexName] ON (username(length))
◆ 创建表的时候直接指定
CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, INDEX [indexName] (username(length)) );
删除索引的语法：
DROP INDEX [indexName] ON mytable;
(2)唯一索引
它与前面的普通索引类似，不同的就是：索引列的值必须唯一，但允许有空值。如果是组合索引，则列值的组合必须唯一。它有以下几种创建方式：
◆创建索引
CREATE UNIQUE INDEX indexName ON mytable(username(length))
◆修改表结构
ALTER mytable ADD UNIQUE [indexName] ON (username(length))
◆创建表的时候直接指定
CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, UNIQUE [indexName] (username(length)) );
(3)主键索引
它是一种特殊的唯一索引，不允许有空值。一般是在建表的时候同时创建主键索引：
CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, PRIMARY KEY(ID) );
当然也可以用 ALTER 命令。记住：一个表只能有一个主键。
(4)组合索引
为了形象地对比单列索引和组合索引，为表添加多个字段：
CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, city VARCHAR(50) NOT NULL, age INT NOT NULL );
为了进一步榨取MySQL的效率，就要考虑建立组合索引。就是将 name, city, age建到一个索引里：
ALTER TABLE mytable ADD INDEX name_city_age (name(10),city,age);
建表时，usernname长度为 16，这里用 10。这是因为一般情况下名字的长度不会超过10，这样会加速索引查询速度，还会减少索引文件的大小，提高INSERT的更新速度。
如果分别在 usernname，city，age上建立单列索引，让该表有3个单列索引，查询时和上述的组合索引效率也会大不一样，远远低于我们的组合索引。虽然此时有了三个索引，但MySQL只能用到其中的那个它认为似乎是最有效率的单列索引。
建立这样的组合索引，其实是相当于分别建立了下面三组组合索引：
usernname,city,age usernname,city usernname
为什么没有 city，age这样的组合索引呢?这是因为MySQL组合索引“最左前缀”的结果。简单的理解就是只从最左面的开始组合。并不是只要包含这三列的查询都会用到该组合索引，下面的几个SQL就会用到这个组合索引：
SELECT * FROM mytable WHREE username="admin" AND city="郑州" SELECT * FROM mytable WHREE username="admin"
而下面几个则不会用到：
SELECT * FROM mytable WHREE age=20 AND city="郑州" SELECT * FROM mytable WHREE city="郑州"
(5)建立索引的时机
到这里我们已经学会了建立索引，那么我们需要在什么情况下建立索引呢?一般来说，在WHERE和JOIN中出现的列需要建立索引，但也不完全如此，因为MySQL只对<，<=，=，>，>=，BETWEEN，IN，以及某些时候的LIKE才会使用索引。例如：
SELECT t.Name FROM mytable t LEFT JOIN mytable m ON t.Name=m.username WHERE m.age=20 AND m.city=\'郑州\'
此时就需要对city和age建立索引，由于mytable表的 userame也出现在了JOIN子句中，也有对它建立索引的必要。
刚才提到只有某些时候的LIKE才需建立索引。因为在以通配符%和_开头作查询时，MySQL不会使用索引。例如下句会使用索引：
SELECT * FROM mytable WHERE username like\'admin%\'
而下句就不会使用：
SELECT * FROM mytable WHEREt Name like\'%admin\'
因此，在使用LIKE时应注意以上的区别。
(6)索引的不足之处
上面都在说使用索引的好处，但过多的使用索引将会造成滥用。因此索引也会有它的缺点：
◆虽然索引大大提高了查询速度，同时却会降低更新表的速度，如对表进行 INSERT、UPDATE和DELETE。因为更新表时，MySQL不仅要保存数据，还要保存一下索引文件。
◆建立索引会占用磁盘空间的索引文件。一般情况这个问题不太严重，但如果你在一个大表上创建了多种组合索引，索引文件的会膨胀很快。
索引只是提高效率的一个因素，如果你的 MySQL有大数据量的表，就需要花时间研究建立最优秀的索引，或优化查询语句。
(7)使用索引的注意事项
使用索引时，有以下一些技巧和注意事项：
◆索引不会包含有NULL值的列
只要列中包含有NULL值都将不会被包含在索引中，复合索引中只要有一列含有 NULL值，那么这一列对于此复合索引就是无效的。所以我们在数据库设计时不要让字段的默认值为NULL。
◆使用短索引
对串列进行索引，如果可能应该指定一个前缀长度。例如，如果有一个CHAR(255)的列，如果在前10个或20个字符内，多数值是惟一的，那么就不要对整个列进行索引。短索引不仅可以提高查询速度而且可以节省磁盘空间和I/O操作。
◆索引列排序
MySQL查询只使用一个索引，因此如果 where子句中已经使用了索引的话，那么order by中的列是不会使用索引的。因此数据库默认排序可以符合要求的情况下不要使用排序操作;尽量不要包含多个列的排序，如果需要最好给这些列创建复合索引。
◆like语句操作
一般情况下不鼓励使用like操作，如果非使用不可，如何使用也是一个问题。like “%aaa%” 不会使用索引而like “aaa%”可以使用索引。
◆不要在列上进行运算
select * from users where YEAR(adddate)<2007;
将在每个行上进行运算，这将导致索引失效而进行全表扫描，因此我们可以改成
select * from users where adddate<‘2007-01-01’;
◆不使用NOT IN和<>操作
以上，就对其中MySQL索引类型进行了介绍。
转自： http://www.zbitedu.com/?action-viewthread-tid-33491 参考技术A 谈到索引，大家并不陌生。索引本身是一种数据结构，存在的目的主要是为了缩短数据检索的时间，最大程度减少磁盘 IO。
任何有数据的场景几乎都有索引，比如手机通讯录、文件系统（ext4\xfs\ntfs)、数据库系统（MySQL\Oracle）。数据库系统和文件系统一般都采用 B+ 树来存储索引信息，B+ 树兼顾写和读的性能，最极端时检索复杂度为 O(logN)，其中 N 指的是节点数量，logN 表示对磁盘 IO 扫描的总次数。

以上是关于MySQL索引的主要内容，如果未能解决你的问题，请参考以下文章