MariaDB Spider蜘蛛侠轻松解决表的横纵向扩展

Posted 2020-09-14

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了MariaDB Spider蜘蛛侠轻松解决表的横纵向扩展相关的知识，希望对你有一定的参考价值。

什么是Spider？

当您的数据库不断增长时，您绝对需要考虑其他技术，如数据库分片。Spider是MariaDB内置的一个可插拔用于MariaDB/mysql数据库分片的存储引擎，充当应用服务器和远程后端DB之间的代理（中间件），它可以轻松实现MySQL的横向和纵向扩展，突破单台MySQL的限制，支持范围分区、列表分区、哈希分区，支持XA分布式事务，支持跨库join。通过Spider，您可以跨多个数据库后端有效访问数据，让您的应用程序一行代码不改，即可轻松实现分库分表！

分库分表架构图：

应用程序连接Spider，Spider充当中间件代理，将客户端查询的请求，按照事先定义好的分片规则，分发给后端数据库，之后返回的数据汇总在Spider内存里做聚合，最终返回客户端请求，对于应用程序而言是透明的。

分片字段的选取：

一定要针对业务上查询最频繁的字段做片键，查询时会直接路由到后端DB上，否则会轮训遍历后端所有DB，跨多个网络性能就会下降。

1、范围分片的优点是无限扩容，但缺点是冷热数据不均匀。

2、HASH分片解决了冷热数据不均匀的问题，但今后扩容比较麻烦，比如之前对表取模了128张，今后变更为256张，数据要重新导入。

典型案例---腾讯游戏

腾讯游戏的生产环境数据量达到了100TB，用了396个Spider节点做数据拆分，分片后的数据用了2800个MySQL节点存储。

使用场景介绍

下面我介绍一下我负责的一个项目，通过Spider实现了历史表的垂直拆分的经验分享。随着业务的增长，单台服务器磁盘空间有限，有些业务上的历史数据，DBA用工具pt-archiver归档后，历史表就没有用了，通常我们会把他单独迁移到备份机，主库上就删除了。但有的时候，BI统计部门来了一个需求，需要临时关联查询这些历史表，那么DBA需要从备份机上myloader导入到从库上去，为了降低导数据引起的从库CPU升高、磁盘IO的瞬间增大，可能造成主从复制的延迟，为了减少这种重复性的体力工作，为了更快速的缩短可用时间，我们可以通过Spider引擎解决，通过它你可以将远程服务器上的表做一个映射，做一个软连接，相当于你操作本地的表一样，简单而便捷，省去了那么多麻烦，临时提供给业务方用，你也不用考虑啥性能问题。

架构图如下：

实施这个方案，选择Spider引擎是有优势的：SQL解析和查询优化是个非常复杂而且很难做好的工作，其他替代产品都是自己实现，由于复杂性，这些产品都带来了一些限，比如不支持存储过程、函数、视图等，给使用和实施带来了困难。而作为一个存储引擎，这些工作都由MariaDB自身完成了，可以方便的将大表做分布式拆分，和Fabric相比，它的好处是对业务方使用是透明的，SQL语法没有任何限制，在不改变现有DB架构的方案中，侵入性最小。

内部原理架构图如下：