分库分表理论概述

Posted zouhong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分库分表理论概述相关的知识,希望对你有一定的参考价值。

1.什么是分库分表

一个库一个表 拆分为 N个库N个表
分为垂直拆分,水平拆分

2.为什么要分库分表

随着业务发展,表的数量,以及单表数据量越来越大,而由于无法分布式部署(部分数据库支持),单台服务器资源(cpu 内存,IO)的限制,导致数据操作开销大,查询慢,因此需要进行分库分表,提高数据查询速度。
常见优化策略:
更换数据库(缓存)
SQL 索引 字段 优化
分区
读写分离
分库分表

3.读写分离

master-slave模式,mastr负责更新操作,slave负责查询操作。

4.分库分表常见方式

垂直拆分:

根据字段拆分

垂直分库:

按照业务划分,将不同业务数据单独拆分成一个库。“微服务治理”做法类似,每个微服务单独使用一个库。


技术图片
垂直分库
垂直分表

如果单表字段过多,可以通过"大表拆小表"方式将不常用或者字段长度较大的表
拆分到扩展表中,mysql是按照数据页进行存储的,如果单行数据过大,会导致数据跨页,造成额外的性能开销。


技术图片
垂直分表
垂直拆分优点:
  • 业务系统解耦。
  • 与微服务治理类似,便于集中管理,监控,扩展
  • 高并发情况下提升IO,数据库连接数,单机硬件资源瓶颈
垂直拆分缺点:
  • 多表join只能通过应用程序解决,加大开发复杂度
  • 分布式事务处理复杂
  • 单表数据总量无法解决(水平切分处理)
水平拆分

将一个表中的数据以某一个字段(取模),拆分到多个表中(根据内容拆分

技术图片
水平拆分
水平拆分的优点:
  • 使单表的数量保持在一定数量,提高查询性能
  • 切分后表结构相同,程序改动小
水平拆分的缺点:
  • 数据扩容
  • 分片规则难以抽象(不同的库,难以固定某个字段拆分,比如商品可以商品IDhash到某个库中,订单表需要根据用户IDhash到某个库中)
  • 分布式事务,部分业务无法关联join

5.分库分表带来的问题

  • 分布式事务
  • 表join
    -分布式全局唯一Id(twitter开源的 snowFlake)

6.分库分表算法

取模

通过 某一个字段进行hash userId%3 =1 则分配到1库。可以使数据均匀分布,避免数据热点问题。数据扩容是明显的缺点,可以采用 一致性hash 算法

范围

比如按月 按省分配

预定义

1亿数据 每个库存100万数据,可以预先创建10个库。

7.常用的中间件

分为两种类型:
Proxy代理:
mycat(重)、mysql-proxy atlas、sharding-proxy(sharding-sphere )

技术图片
Proxy代理

jdbc直连:
TDDL(淘宝 半开源) 、sharding-jdbc(sharding-sphere )

技术图片
jdbc直连


作者:3517a85fd522
链接:https://www.jianshu.com/p/658bc9151e7b
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

以上是关于分库分表理论概述的主要内容,如果未能解决你的问题,请参考以下文章

分库分表 ---SpringBoot + ShardingSphere 实现分表

分库分表 ---SpringBoot + ShardingSphere 实现读写分离

分库分表 ---SpringBoot + ShardingSphere 实现分库分表

分库分表 ---SpringBoot + ShardingSphere 实现分表

浅谈高性能数据库集群之分库分表

分库分表--- SpringBoot+ShardingSphere实现分表+ 读写分离