mysql索引详解

Posted linyouyi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mysql索引详解相关的知识,希望对你有一定的参考价值。

索引的定义
  mysql官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构.可以得出索引的本质就是数据结构
  你可以简单理解为"排序好的快速查找数据结构"
  在数据之外,数据库还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构的基础上实现高级查找算法,这种数据结构就是索引
  一般来说索引本身很大,不适合全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上
  我们平常所说的索引,如果没有特别指明,都是指B树(多路搜索树,并不一定是二叉的)结构组织的索引,其中聚集索引,次要索引,覆盖索引
  复合索引,前缀索引,唯一索引默认都是使用B+树索引,统称索引.当然,除了B+树这种类型的索引之外,还有哈稀索引(hash index)等

优势
  类似大学图书馆建书目录索引,提高数据检索的效率,降低数据库的IO成本
  通过索引列对数据进行排序,降低数据排序成本,降低了CPU的消耗
劣势
  实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引也是要占内存空间的
  虽然索引大大提高了查询速度,同时都会降低更新表的速度,如对表进行insert,update和delete
  因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引的字段,都会调整因为更新所带来的键值变化后的索引信息
  索引只是高效的一个因素,如果你的MySQL有大数据量的表,就需要花时间研究建立最优秀的索引,或优化查询方法

索引的分类
  单值索引:即一个索引只包含单个列,一个表不可以有多个单列索引
  唯一索引:索引列的值必须唯一,但允许有控制,例如手机号,银行卡号等值必须是唯一
  复合索引:即一个索引包含多个列,例如手机号和银行卡号一起
基本语法
  创建:create [unique] index indexName on tbname(columnname(lenght))
  更改:alter table tbname add [unique] index [indexName] on (columnname(lenght))
  更改:alter table tbname add [unique] fulltext [indexName] on (columnname(lenght))#指定索引为fulltext,用于全文索引
  删除:drop index [indexName] on tbname;
  查看:show index from tbnameG;

索引结构
  BTree索引
  Hash索引
  full-text全文索引
  R-Tree索引


哪种情况需要创建索引
  1.主键自动建立唯一索引
  2.频繁作为查询条件的字段应该创建索引
  3.查询中与其他表关联的字段,外键关系建立索引
  4.频繁更新的字段不适合创建索引,因为每次更新不单单是更新数据还会更新索引
  5.Where条件里用得到的字段适合创建索引
  6.单键/组合索引的选择问题,在高并发下倾向创建组合索引
  7.查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度
  8.查询中统计或者分组字段
哪种情况不需要建索引
  1.表记录太少(一般生产环境下,三百万条记录性能就可能开始下降,官方说的是五百万到八百万)
  2.经常增删改的表
  3.某个数据列的值包含许多重复的内容

 

性能分析

1.MySQL Query Optimizer(查询优化器)
  1.1MySQL中有专门负责优化select语句的优化器模块,主要功能:通过计算分析系统中收集到的统计信息,为客户端请求的query提供它认为最有的执行计划(它认为最优的数据检索方式,但不见得是DBA认为是最优的,这部分是最耗时间的)
  1.2当客户端向MySQL请求一条query,命令解析其模块完成请求分类,区别是select并转发给MySQL Query Optimizer时,MySQL Query Optimizer首先会对整条Query进行优化,处理掉一些常量表达式的预算,直接转换成常量值,并对query中的查询条件进行简化和转换,如去掉一些无用或显而易见的条件,结构调整等,然后分析query中的Hint信息(如果有),看显示Hint信息是否可以完全确定该query的执行计划,如果没有Hint或Hint信息不足以完全确定执行计划,则会读取所涉及对象的统计信息,根据query进行写相应的计算分析,然后再得出最后的执行计划。

2.MySQL常见瓶颈
  CPU:CPU在饱和的时候一般发生在数据装入内存或从磁盘读取数据时候
  IO:磁盘IO瓶颈发生在装入数据远大于内存容量的时候
  服务器硬件的性能瓶颈,top,free,iostat和vmstat来查看系统的性能状态

3.Explain
3.1能干什么
  表的读取顺序
  数据读取操作的操作类型
  哪些索引可以使用
  哪些索引被实际使用
  表之间的引用
  每张表有多少被优化器查询
3.2怎么用
  explain+SQL语句
  执行计划包含以下的信息
  id>select_type>table>type>possible_keys>key>key_len>ref>rows>extra






























































以上是关于mysql索引详解的主要内容,如果未能解决你的问题,请参考以下文章

MySQL索引与事务详解

MySQL索引详解

MySQL 联合索引详解

MySQL索引详解

mysql索引数据结构详解---mysql详解

MySQL进阶实战 3,mysql索引详解,上篇