Flume系列之:记录一次上游数据库产生大量数据导致flume agent数据堆积和服务器IO打满,严重影响下游任务的快速应对处理方法
Posted 最笨的羊羊
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Flume系列之:记录一次上游数据库产生大量数据导致flume agent数据堆积和服务器IO打满,严重影响下游任务的快速应对处理方法相关的知识,希望对你有一定的参考价值。
Flume系列之:记录一次上游数据库产生大量数据导致flume agent数据堆积和服务器IO打满,严重影响下游任务的快速应对处理方法
一、背景
- Debezium采集数据并发送到Kafka,由一个flume agent接收多个数据库的数据,其中一个数据库产生大量数据,导致flume channel数据堆积,服务器io打满,导致数据消费不及时,影响了其他数据库,导致下游任务都产生了延迟
主要产生以下影响:
- 数据堆积
du -sh *
709G flume_agent1
- io打满
iostat -x 1 10
Device %util
vdb %100
二、快速应对解决方法
- 步骤一:首先需要快速定位产生大量数据库的数据
- 步骤二:确定产生大量数据的数据库是否是正常业务需求,如果是可以考虑先创建一个新的flume agent接收这个数据库的数据,再把这个数
以上是关于Flume系列之:记录一次上游数据库产生大量数据导致flume agent数据堆积和服务器IO打满,严重影响下游任务的快速应对处理方法的主要内容,如果未能解决你的问题,请参考以下文章
flume系列之:python读取flume配置文件,并把配置写入到zookeeper节点,再根据写入到zookeeper中的配置启动flume agent