Flume 参数调优
Posted xiangyuguan
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Flume 参数调优相关的知识,希望对你有一定的参考价值。
Flume 参数调优
-
Source
-
增加 Source 数量(使用 Tair Dir Source 时可增加 FileGroups 个数),可以增大 Source 的读取数据的能力。例如:当某一个目录产生的文件过多时需要将这个文件目录拆分成多个文件目录,同时配置好多个 Source 以保证 Source 有足够的能力获取到新产生的数据。batchSize 参数决定 Source 一次批量运输到 Channel 的 event 条数,适当调大这个参数可以提高 Source 搬运 Event 到 Channel 时的性能
-
-
Channel
-
type 选择 memory 时 Channel 的性能最好,但是如果 Flume 进程意外挂掉可能会丢失数据。type 选择 file 时 Channel 的容错性更好,但是性能上会比 memory channel 差。使用 file Channel 时 dataDirs 配置多个不同盘下的目录可以提高性能。Capacity 参数决定 Channel 可容纳最大的 event 条数。transactionCapacity 参数决定每次Source 往 channel 里面写的最大 event 条数和每次 Sink 从 channel 里面读的最大 event 条数。transactionCapacity 需要大于 Source 和 Sink 的 batchSize 参数
-
-
Sink
-
以上是关于Flume 参数调优的主要内容,如果未能解决你的问题,请参考以下文章