flume agents topology

Posted mrerror

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了flume agents topology相关的知识,希望对你有一定的参考价值。

技术图片

  Apache Flume is a distributed, reliable, and available system for efficiently collecting, aggregating and moving large amounts of log data from many different sources to a centralized data store.

 Flume Transcation (事务)

  Channel 中的数据只有在被Sink 端消费(也就是数据传输到下一个Agent或写入到文件后)才会在Channel中删除相应数据。

  从soucrce到channel:一旦事务中所有的事件全部传递到channel且提交成功,那么source就将该文件标记为完成。

  从channel到sink:如果下游事件没有被正常消费,那么事务将会回滚;且所有的事件都会保持到channel中,等待重新传递。

 Flume Interceptor(拦截器)

  Timestamp Interceptor: 时间戳拦截器,将当前时间戳(毫秒)加入到events header中,key名字为:timestamp,值为当前时间戳。

  Host Interceptor: 主机名拦截器。将运行Flume agent的主机名或者IP地址加入到events header中,key名字为:host(也可自定义)。

  Static Interceptor: 静态拦截器,用于在events header中加入一组静态的key和value。

  UUID Interceptor: UUID拦截器,用于在每个events header中生成一个UUID字符串

  Regex Filtering Interceptor:

  Regex Extractor Interceptor:

 Flume Channel Selectors

  Replicating(复制)同一个Event会发送给每一个Channel 中,默认使用;

  Multiplexing(复用)同一个Event只会选择多个Channel中的一个发送

  自定义Selectors

 

以上是关于flume agents topology的主要内容,如果未能解决你的问题,请参考以下文章

基础组件1Flume入门Agent

flume agents topology

Flume 3集群如何采集信息呢?

Flume使用入门

flume配置文件

0#1hadoop生态圈之日志采集框架Flume入门