为啥有关MongoDB采用B树索引，以及Mysql B+树做索引

Posted 2023-04-25

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了为啥有关MongoDB采用B树索引，以及Mysql B+树做索引相关的知识，希望对你有一定的参考价值。

先从数据结构的角度来答。
题主应该知道b-树和b+树最重要的一个区别就是b+树只有叶节点存放数据，其余节点用来索引，而b-树是每个索引节点都会有data域。
这就决定了b+树更适合用来存储外部数据，也就是所谓的磁盘数据。
从mysql（inoodb）的角度来看，b+树是用来充当索引的，一般来说索引非常大，尤其是关系性数据库这种数据量大的索引能达到亿级别，所以为了减少内存的占用，索引也会被存储在磁盘上。
那么mysql如何衡量查询效率呢？磁盘io次数，b-树（b类树）的特定就是每层节点数目非常多，层数很少，目的就是为了就少磁盘io次数，当查询数据的时候，最好的情况就是很快找到目标索引，然后读取数据，使用b+树就能很好的完成这个目的，但是b-树的每个节点都有data域（指针），这无疑增大了节点大小，说白了增加了磁盘io次数（磁盘io一次读出的数据量大小是固定的，单个数据变大，每次读出的就少，io次数增多，一次io多耗时啊！），而b+树除了叶子节点其它节点并不存储数据，节点小，磁盘io次数就少。这是优点之一。
另一个优点是什么，b+树所有的data域在叶子节点，一般来说都会进行一个优化，就是将所有的叶子节点用指针串起来。这样遍历叶子节点就能获得全部数据，这样就能进行区间访问啦。
至于mongodb为什么使用b-树而不是b+树，可以从它的设计角度来考虑，它并不是传统的关系性数据库，而是以json格式作为存储的nosql，目的就是高性能，高可用，易扩展。首先它摆脱了关系模型，上面所述的优点2需求就没那么强烈了，其次mysql由于使用b+树，数据都在叶节点上，每次查询都需要访问到叶节点，而mongodb使用b-树，所有节点都有data域，只要找到指定索引就可以进行访问，无疑单次查询平均快于mysql（但侧面来看mysql至少平均查询耗时差不多）。
总体来说，mysql选用b+树和mongodb选用b-树还是以自己的需求来选择的。参考技术A 先从数据结构的角度来答。
题主应该知道b-树和b+树最重要的一个区别就是b+树只有叶节点存放数据，其余节点用来索引，而b-树是每个索引节点都会有data域。
这就决定了b+树更适合用来存储外部数据，也就是所谓的磁盘数据。
从mysql（inoodb）的角度来看，b+树是用来充当索引的，一般来说索引非常大，尤其是关系性数据库这种数据量大的索引能达到亿级别，所以为了减少内存的占用，索引也会被存储在磁盘上。
那么mysql如何衡量查询效率呢？磁盘io次数，b-树（b类树）的特定就是每层节点数目非常多，层数很少，目的就是为了就少磁盘io次数，当查询数据的时候，最好的情况就是很快找到目标索引，然后读取数据，使用b+树就能很好的完成这个目的，但是b-树的每个节点都有data域（指针），这无疑增大了节点大小，说白了增加了磁盘io次数（磁盘io一次读出的数据量大小是固定的，单个数据变大，每次读出的就少，io次数增多，一次io多耗时啊！），而b+树除了叶子节点其它节点并不存储数据，节点小，磁盘io次数就少。这是优点之一。
另一个优点是什么，b+树所有的data域在叶子节点，一般来说都会进行一个优化，就是将所有的叶子节点用指针串起来。这样遍历叶子节点就能获得全部数据，这样就能进行区间访问啦。
至于mongodb为什么使用b-树而不是b+树，可以从它的设计角度来考虑，它并不是传统的关系性数据库，而是以json格式作为存储的nosql，目的就是高性能，高可用，易扩展。首先它摆脱了关系模型，上面所述的优点2需求就没那么强烈了，其次mysql由于使用b+树，数据都在叶节点上，每次查询都需要访问到叶节点，而mongodb使用b-树，所有节点都有data域，只要找到指定索引就可以进行访问，无疑单次查询平均快于mysql（但侧面来看mysql至少平均查询耗时差不多）。
总体来说，mysql选用b+树和mongodb选用b-树还是以自己的需求来选择的。参考技术B 先从数据结构的角度来答。题主应该知道B-树和B+树最重要的一个区别就是B+树只有叶节点存放数据，其余节点用来索引，而B-树是每个索引节点都会有Data域。这就决定了B+树更适合用来存储外部数据，也就是所谓的磁盘数据。从Mysql（Inoodb）的角...本回答被提问者采纳