分库分表理论概述
Posted zouhong
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了分库分表理论概述相关的知识,希望对你有一定的参考价值。
1.什么是分库分表
一个库一个表 拆分为 N个库N个表
分为垂直拆分,水平拆分
2.为什么要分库分表
随着业务发展,表的数量,以及单表数据量越来越大,而由于无法分布式部署(部分数据库支持),单台服务器资源(cpu 内存,IO)的限制,导致数据操作开销大,查询慢,因此需要进行分库分表,提高数据查询速度。
常见优化策略:
更换数据库(缓存)
SQL 索引 字段 优化
分区
读写分离
分库分表
3.读写分离
master-slave模式,mastr负责更新操作,slave负责查询操作。
4.分库分表常见方式
垂直拆分:
(根据字段拆分)
垂直分库:
按照业务划分,将不同业务数据单独拆分成一个库。“微服务治理”做法类似,每个微服务单独使用一个库。
垂直分表
如果单表字段过多,可以通过"大表拆小表"方式将不常用或者字段长度较大的表
拆分到扩展表中,mysql是按照数据页进行存储的,如果单行数据过大,会导致数据跨页,造成额外的性能开销。
垂直拆分优点:
- 业务系统解耦。
- 与微服务治理类似,便于集中管理,监控,扩展
- 高并发情况下提升IO,数据库连接数,单机硬件资源瓶颈
垂直拆分缺点:
- 多表join只能通过应用程序解决,加大开发复杂度
- 分布式事务处理复杂
- 单表数据总量无法解决(水平切分处理)
水平拆分
将一个表中的数据以某一个字段(取模),拆分到多个表中(根据内容拆分)
水平拆分的优点:
- 使单表的数量保持在一定数量,提高查询性能
- 切分后表结构相同,程序改动小
水平拆分的缺点:
- 数据扩容
- 分片规则难以抽象(不同的库,难以固定某个字段拆分,比如商品可以商品IDhash到某个库中,订单表需要根据用户IDhash到某个库中)
- 分布式事务,部分业务无法关联join
5.分库分表带来的问题
- 分布式事务
- 表join
-分布式全局唯一Id(twitter开源的 snowFlake)
6.分库分表算法
取模
通过 某一个字段进行hash userId%3 =1 则分配到1库。可以使数据均匀分布,避免数据热点问题。数据扩容是明显的缺点,可以采用 一致性hash 算法
范围
比如按月 按省分配
预定义
1亿数据 每个库存100万数据,可以预先创建10个库。
7.常用的中间件
分为两种类型:
Proxy代理:
mycat(重)、mysql-proxy atlas、sharding-proxy(sharding-sphere )
jdbc直连:
TDDL(淘宝 半开源) 、sharding-jdbc(sharding-sphere )
作者:3517a85fd522
链接:https://www.jianshu.com/p/658bc9151e7b
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
以上是关于分库分表理论概述的主要内容,如果未能解决你的问题,请参考以下文章
分库分表 ---SpringBoot + ShardingSphere 实现分表
分库分表 ---SpringBoot + ShardingSphere 实现读写分离
分库分表 ---SpringBoot + ShardingSphere 实现分库分表