Flume系列之:记录一次上游数据库产生大量数据导致flume agent数据堆积和服务器IO打满,严重影响下游任务的快速应对处理方法

Posted 最笨的羊羊

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Flume系列之:记录一次上游数据库产生大量数据导致flume agent数据堆积和服务器IO打满,严重影响下游任务的快速应对处理方法相关的知识,希望对你有一定的参考价值。

Flume系列之:记录一次上游数据库产生大量数据导致flume agent数据堆积和服务器IO打满,严重影响下游任务的快速应对处理方法

一、背景

  • Debezium采集数据并发送到Kafka,由一个flume agent接收多个数据库的数据,其中一个数据库产生大量数据,导致flume channel数据堆积,服务器io打满,导致数据消费不及时,影响了其他数据库,导致下游任务都产生了延迟

主要产生以下影响:

  • 数据堆积
du -sh *
709G flume_agent1
  • io打满
iostat -x 1 10
Device      %util
vdb         %100

二、快速应对解决方法

  • 步骤一:首先需要快速定位产生大量数据库的数据
  • 步骤二:确定产生大量数据的数据库是否是正常业务需求,如果是可以考虑先创建一个新的flume agent接收这个数据库的数据,再把这个数

以上是关于Flume系列之:记录一次上游数据库产生大量数据导致flume agent数据堆积和服务器IO打满,严重影响下游任务的快速应对处理方法的主要内容,如果未能解决你的问题,请参考以下文章

技术干货 | 大数据开发系列之Flume

kettle庖丁解牛第32篇之本地和上游数据量比较后再抽取

Flume---大数据协作框架

Flume系列一之架构介绍和安装

004- Flume Source之Kafka

flume系列之:python读取flume配置文件,并把配置写入到zookeeper节点,再根据写入到zookeeper中的配置启动flume agent