MongoDB中的索引操作总结

Posted cui_yonghua

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MongoDB中的索引操作总结相关的知识,希望对你有一定的参考价值。

基础篇(能解决工作中80%的问题):

  1. MongoDB的概述、应用场景、下载方式、连接方式和发展历史等

  2. MongoDB数据类型、重要概念以及shell常用指令

  3. MongoDB文档的各种增加、更新、删除操作总结

  4. MongoDB各种查询操作总结

  5. MongoDB对列的各种操作总结

  6. MongoDB中的索引操作总结

进阶篇:

  1. MongoDB聚合操作总结

  2. MongoDB的导入导出、备份恢复总结

  3. MongoDB的用户管理总结

  4. MongoDB复制(副本集)总结

  5. MongoDB 分片总结

  6. MongoDB 遇见 spark(进行整合)

  7. MongoDB内部的存储原理

其它:

  1. python3操作MongoDB的各种案例

  2. MongoDB命令汇总

一. 概述

索引通常能够极大的提高查询的效率,如果没有索引,MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录。这种扫描全集合的查询效率是非常低的,特别在处理大量的数据时,查询可以要花费几十秒甚至几分钟,这对网站的性能是非常致命的。

索引是特殊的数据结构,索引存储在一个易于遍历读取的数据集合中,索引是对数据库表中一列或多列的值进行排序的一种结构

索引(Index)是帮助mysql高效获取数据的数据结构。
可以得到索引的本质:索引是数据结构。
可以简单理解为“排好序的快速查找数据结构”。

索引存储一个特定字段或一组字段的值,按该字段的值排序。索引条目的排序支持有效的相等匹配和基于范围的查询操作。

另外,MongoDB可以通过使用索引中的顺序来返回排序的结果。

索引原理:MongoDB索引的数据结构默认为B-Tree。B-Tree类型的索引结构的特点:

  1. 每个叶子节点的深度都相同,通常为3层或者4层;
  2. 查询操作时,性能非常客观;
  3. 对于范围查询来说,直接遍历叶子节点的链表就能快速定位到匹配文档记录的指针位置。

官方文档-索引https://www.mongodb.com/docs/manual/indexes/

二. 索引的常见操作

2.1 创建索引

MongoDB使用 createIndex() 方法来创建索引。( 3.0.0 版本后增加)

语法格式:db.collection.createIndex(keys, options)

语法中 Key 值为你要创建的索引字段,1 为指定按升序创建索引,如果你想按降序来创建索引指定为 -1 即可。

可选参数如下:

background Boolean类型, 建索引过程会阻塞其它数据库操作,background可指定以后台方式创建索引,即增加 “background” 可选参数。 “background” 默认值为false。

unique Boolean类型, 建立的索引是否唯一。指定为true创建唯一索引。默认值为false.

name Boolean类型, 索引的名称。如果未指定,MongoDB的通过连接索引的字段名和排序顺序生成一个索引名称。

dropDups Boolean类型, 在建立唯一索引时是否删除重复记录,指定 true 创建唯一索引。默认值为 false.

sparse Boolean类型, 对文档中不存在的字段数据不启用索引;这个参数需要特别注意,如果设置为true的话,在索引字段中不会查询出不包含对应字段的文档.。默认值为 false.

expireAfterSeconds integer类型, 指定一个以秒为单位的数值,完成 TTL设定,设定集合的生存时间。

v 索引的版本号。默认的索引版本取决于mongod创建索引时运行的版本。

weights 索引权重值,数值在 1 到 99,999 之间,表示该索引相对于其他索引字段的得分权重。

default_language Boolean类型, 对于文本索引,该参数决定了停用词及词干和词器的规则的列表。 默认为英语

language_override Boolean类型, 对于文本索引,该参数指定了包含在文档中的字段名,语言覆盖默认的language,默认值为 language.

案例1:创建索引

db.col.createIndex("title":1)

案例2:createIndex() 方法中你也可以设置使用多个字段创建索引(关系型数据库中称作复合索引)。

db.col.createIndex("title":1,"description":-1)

案例3:在后台创建索引

db.values.createIndex(open: 1, close: 1, background: true)

注:MongoDB也可以使用 ensureIndex()方法来创建索引, 3.0.0版本后也能用,但只是 createIndex() 的别名。

2.2 常用指令

1、查看集合索引:db.col.getIndexes()

2、查看集合索引大小:db.col.totalIndexSize()

3、删除集合所有索引:db.col.dropIndexes()

4、删除集合指定索引:db.col.dropIndex("索引名称")

5、利用 TTL 集合对存储的数据进行失效时间设置:经过指定的时间段后或在指定的时间点过期,MongoDB 独立线程去清除数据。类似于设置定时自动删除任务,可以清除历史记录或日志等前提条件,设置 Index 的关键字段为日期类型 new Date()。

案例:例如数据记录中 createDate 为日期类型时:①设置时间180秒后自动清除;②设置在创建记录后,180 秒左右删除。

db.col.createIndex("createDate": 1,expireAfterSeconds: 180)

三、索引限制

3.1、最大范围

集合中索引不能超过64个
索引名的长度不能超过125个字符
一个复合索引最多可以有31个字段

3.2、查询限制

索引不能被以下的查询使用:

  • 正则表达式及非操作符,如 $nin, $not, 等。
  • 算术运算符,如 $mod, 等。
  • $where 子句

所以,检测语句是否使用索引是一个好的习惯,可以用explain来查看。

3.3、额外开销

使用索引是有代价的,对于添加的每一个索引,每次写操作(插入、更新、删除)都将耗费更多的时间。这是因为,当数据发生变动时,MongoDB不仅要更新文档,还要更新集合上所有的索引。所以,如果你很少对集合进行读取操作,建议不使用索引。

以上是关于MongoDB中的索引操作总结的主要内容,如果未能解决你的问题,请参考以下文章

Mongodb的索引操作

哈希和升序索引之间的 Mongodb 性能差异(有啥理由不在无序字段中使用哈希?)

MongoDB聚合操作总结

MongoDB聚合操作总结

MongoDB 分片总结

MongoDB创建索引