名词解释
clustered index(聚集索引)
对(primary key)主键索引的一种表述。InnoDB表存储是基于primary key列来组织的,这样做可以加快查询和排序速度。为了获得最好的性能,在选择primary key columns的时候要特别小心。因为修改clustered index(聚集索引)列是一个昂贵的操作,所以选择作为primary的列通常都是很少或者从不会被更新的列。
primary key(主键)
A set of columns(一组列),可以唯一标识表中的每一行。因此,它必须是一个unique index,并且不允许有NULL值。
InnoDB organizes the table storage based on the column values of the primary key.
secondary index(辅助索引或二级索引)
索引的一种类型。一个InnoDB表可以有0个或者多个secondary index。
B-tree
tree数据结构在数据库索引中被广泛采用。这种结构总是有序的。可以快速查找,精确匹配(等于)或者范围匹配(比如,大于、小于、BETWEEN等操作)。大多数的存储引擎都是使用的这种结构,比如InnoDB和MyISAM。
因为B-tree节点可以有许多孩子,一个B-tree和二叉树不一样,二叉树它限制每个结点只能2个孩子。
聚集索引和辅助索引
每个InnoDB表都有一个特别的索引叫clustered index。通常,clustered index和primary key是一个意思。
为了在查询、插入以及数据库的其它操作时获得最好的性能,你必须理解InnoDB中是怎样使用clustered index优化大多数查询的。
- 当你在表中定义了一个PRIMARY KEY的时候,InnoDB会把它作为clustered index。在你创建每一张表的时候最好定义一个primary key,如果实在没有一个或者一组逻辑唯一并且非空的列,你就添加一个新的auto-increment(自增长)的列,让它的值自动填充。
- 如果你没有在你的表中定义PRIMARY KEY,那么mysql将查找第一个所有值非空的唯一索引列作为clustered index。
- 如果表中没有PRIMARY KEY,而且也没有合适的UNIQUE index,那么InnoDB内部将生产一个名字叫GEN_CLUST_INDEX的隐藏clustered index,其值为行ID
Clustered Index是如何加速查询的
通过clustered index来访问一行是非常快的,因为索引检索直接指向数据所在的页。如果一个表很大,clustered index架构通常会节省I/O操作。
Secondary Indexes是如何关联到Clustered Index的
除了clustered index之外的其它索引都叫Secondary Indexes。在secondary index中的每一条记录包含那一行的primary key列。InnoDB用这个primary key的值来检索聚集索引中的行。
如果primary key很长,那么secondary indexes将会占用更多的空间,因此用一个简短的primary key是有好处的。
一个InnoDB索引的物理结构
InnoDB indexes are B-tree data structures. Index records are stored in the leaf pages of their B-tree data structure. The default size of an index page is 16KB.
当一条新记录被插入到InnoDB clustered index中时,InnoDB预留page(页)的1/16的空间以备将来插入或者更新索引记录。如果索引记录是顺序插入的(升序或者降序),那么填满这一页就是剩下的那15/16的空间;如果记录是按照随机顺序插入的,那么填满这一条就是1/2到15/16页。配置项innodb_fill_factor定义每个B-tree page 百分之多少的空间用于存储有序的索引记录,剩下的空间是为以后索引增长而预留的。
你可以通过innodb_page_size设置InnoDB表空间的page size。支持64KB, 32KB, 16KB (default), 8KB, and 4KB.
小结
1、如果表中没有定义primary key,则查找第一个不为空的唯一索引列作为聚集索引,若找不到,则生成一个隐藏的聚集索引
2、插入新记录的时候,预留一页的1/16的空间用于以后的插入或更新
参考 https://dev.mysql.com/doc/refman/5.7/en/innodb-indexes.html