TIDB海量数据新增索引

Posted Liu Hongbo

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了TIDB海量数据新增索引相关的知识,希望对你有一定的参考价值。

TIDB海量数据新增索引

由于创建索引在扫表回填索引的时候会消耗大量资源,甚至与一些频繁更新的字段会发生冲突导致正常业务受到影响。大表创建索引的过程往往会持续很长时间,所以要尽可能地平衡执行时间和集群性能之间的关系,比如选择非高频更新时间段

参数调整:

目前主要使用 tidb_ddl_reorg_worker_cnttidb_ddl_reorg_batch_size 这两个参数来动态调整索引创建速度,通常来说它们的值越小对系统影响越小,但是执行时间越长。

一般情况下,先将值保持为默认的 4 和 256 ,观察集群资源使用情况和响应速度,再逐渐调大 tidb_ddl_reorg_worker_cnt 参数来增加并发,观察监控如果系统没有发生明显的抖动,再逐渐调大 tidb_ddl_reorg_batch_size 参数,但如果索引涉及的列更新很频繁的话就会造成大量冲突造成失败重试。

另外还可以通过调整参数 tidb_ddl_reorg_priorityPRIORITY_HIGH 来让创建索引的任务保持高优先级来提升速度,但在通用 OLTP 系统上,一般建议保持默认。

例:生产1亿数据:

SET GLOBAL  tidb_ddl_reorg_worker_cnt = 16;

SET GLOBAL tidb_ddl_reorg_batch_size = 10240;

以上是关于TIDB海量数据新增索引的主要内容,如果未能解决你的问题,请参考以下文章

还在用分库分表?看TiDB如何解决海量数据无感扩容难题 | Q推荐

TiDB 故障诊断与性能排查:发生即看见,一切可回溯,Continuous Profiling 应用实践

TiDB 海量 region 集群调优实践

vivo x TiDB丨解决云服务海量数据挑战

TiDB 在国信证券海量数据高并发场景中的实践

携程 x TiDB丨应对全球业务海量数据增长,一栈式 HTAP 实现架构革新