大体量数据迁移思路
Posted 老污的猫
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大体量数据迁移思路相关的知识,希望对你有一定的参考价值。
背景
当前系统数据量级别千万级或亿级,单表无法支撑业务量,需要考虑拆表或分表,且迁移同时不能影响线上业务
概况
- 千万或亿级数据量
- 不能影响线上业务,系统24小时运行,不可停机
- 需要拆表迁移数据
方案
考虑到上述情况,在不影响线上业务的情况下,需要将业务数据同步至数据仓库,默认情况下每天凌晨同步前一天的增量&修改数据;再从数据仓库将数据迁移至分表中,可以通过更新时间的字段作为分界线,更新时间小于选定值的数据为初始量,大于选定值得为增量;初始量同步完成后定期同步增量数据,直到写入新表的功能上线
- 数据同步至数仓
- 选定字段分割初始量、增量数据
- 同步初始量数据
- 定期同步增量数据
- 系统上线
- 关闭数据同步
- 下线旧表
以上是关于大体量数据迁移思路的主要内容,如果未能解决你的问题,请参考以下文章