Apache Kafka-核心组件和流程-副本管理器-设计-原理(入门教程轻松学)

Posted 程序员小熊

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Apache Kafka-核心组件和流程-副本管理器-设计-原理(入门教程轻松学)相关的知识,希望对你有一定的参考价值。

作者:稀有气体
来源:CSDN
原文:https://blog.csdn.net/liyiming2017/article/details/82805479
版权声明:本文为博主原创文章,转载请附上博文链接!

本入门教程,涵盖Kafka核心内容,通过实例和大量图表,帮助学习者理解,任何问题欢迎留言。

目录:

本章简单介绍了副本管理器,副本管理器负责分区及其副本的管理。副本管理器具体的工作流程可以参考牟大恩所著的《Kafka入门与实践》。

副本管理器

副本机制使得kafka整个集群中,只要有一个代理存活,就可以保证集群正常运行。这大大提高了Kafka的可靠性和稳定性。

Kafka中代理的存活,需要满足以下两个条件:

  1. 存活的节点要维持和zookeeper的session连接,通过zookeeper的心跳机制实现
  2. Follower副本要与leader副本保持同步,不能落后太多。

满足以上条件的节点在ISR中,一旦宕机,或者中断时间太长,Leader就会把同步副本从ISR中踢出。

所有节点中,leader节点负责接收客户端的读写操作,follower节点从leader复制数据。

副本管理器负责对副本管理。由于副本是分区的副本,所以对副本的管理体现在对分区的管理。

在第三章已经对分区和副本有了详细的讲解,这里再介绍两个重要的概念,LEO和HW。

  1. LEO是Log End Offset缩写。表示每个分区副本的最后一条消息的位置,也就是说每个副本都有LEO。
  2. HW是Hight Watermark缩写,他是一个分区所有副本中,最小的那个LEO。

看下图:

分区test-0有三个副本,每个副本的LEO就是自己最后一条消息的offset。可以看到最小的LEO是Replica2的,等于3,也就是说HW=3。这代表offset=4的消息还没有被所有副本复制,是无法被消费的。而offset<=3的数据已经被所有副本复制,是可以被消费的。

 

副本管理器所承担的职责如下:

  1. 副本过期检查
  2. 追加消息
  3. 拉取消息
  4. 副本同步过程
  5. 副本角色转换
  6. 关闭副本

再此就不再一一讲解了,详情可以参考牟大恩所著的《Kafka入门与实践》。

以上是关于Apache Kafka-核心组件和流程-副本管理器-设计-原理(入门教程轻松学)的主要内容,如果未能解决你的问题,请参考以下文章

Kafka学习资料

Apache Kafka 核心组件和流程-日志管理器-设计-原理(入门教程轻松学)

Apache Kafka 核心组件和流程-日志管理器-设计-原理(入门教程轻松学)

Apache Kafka 核心组件和流程-控制器-设计-原理(入门教程轻松学)

Apache Kafka 核心组件和流程-控制器-设计-原理(入门教程轻松学)

Apache Kafka核心组件和流程-协调器(消费者和组协调器)-设计-原理(入门教程轻松学)