一文解密Kafka，Kafka源码设计与实现原理剖析，真正的通俗易懂

Posted 2023-02-14

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了一文解密Kafka，Kafka源码设计与实现原理剖析，真正的通俗易懂相关的知识，希望对你有一定的参考价值。

参考技术A

Apache Kafka （简称Kafka ）最早是由Linkedln开源出来的分布式消息系统，现在是Apache旗下的一个子项目，并且已经成为开册、领域应用最广泛的消息系统之 Kafka社区也非常活跃，从版本开始， Kafka 的标语已经从“一个高吞吐量、分布式的消息系统”改为“一个分布式的流平台”
关于Kafka，我打算从入门开始讲起，一直到它的底层实现逻辑个原理以及源码，建议大家花点耐心，从头开始看，相信会对你有所收获。

作为个流式数据平台，最重要的是要具备下面个特点

消息系统：
消息系统也叫作消息队列）主要有两种消息模型：队列和发布订Kafka使用消费组（ consumer group ）统上面两种消息模型 Kafka使用队列模型时，它可以将处理作为平均分配给消费组中的消费者成员

下面我们会从个角度分析Kafka 的几个基本概念，并尝试解决下面个问题

消息由生产者发布到 fk 集群后，会被消费者消费消息的消费模型有两种：推送模型（ pu和拉取模型（ pull 基于推送模型的消息系统，由消息代理记录消费者的消费状态消息代理在将消息推送到消费者后标记这条消息为已消费

但这种方式无法很好地保证消息的处理语义比如，消息代理把消息发送出去后，当消费进程挂掉或者由于网络原因没有收到这条消息时，就有可能造成消息丢失（因为消息代理已经这条消息标记为自己消费了，但实际上这条消息并没有被实际处理）如果要保证消息的处理语义，消息代理发送完消息后，要设置状态为“已发送”，只有收到消费者的确认请求后才更新为“已消费”，这就需要在消息代理中记录所有消息的消费状态，这种做法也是不可取的

Kafka每个主题的多个分区日志分布式地存储在Kafka集群上，同时为了故障容错，每个分区都会以副本的方式复制到多个消息代理节点上其中一个节点会作为主副本（ Leader ），其节点作为备份副本（ Follower ，也叫作从副本）

主副本会负责所有的客户端读写操作，备份副本仅仅从主副本同步数据当主副本 IH 现在故障时，备份副本中的副本会被选择为新的主副本因为每个分区的副本中只有主副本接受读写，所以每个服务端都会作为某些分区的主副本，以及另外一些分区的备份副本这样Kafka集群的所有服务端整体上对客户端是负载均衡的

消息系统通常由生产者「pro ucer 消费者（ co sumer ）和消息代理（ broke 大部分组成，生产者会将消息写入消息代理，消费者会从消息代理中读取消息对于消息代理而言，生产者和消费者都属于客户端：生产者和消费者会发送客户端请求给服务端，服务端的处理分别是存储消息和获取消息，最后服务端返回响应结果给客户端

新的生产者应用程序使用 af aP oduce 对象代表个生产者客户端进程生产者要发送消息，并不是直接发送给务端，而是先在客户端消息放入队列然后一个息发送线程从队列中消息，以盐的方式发送消息给服务端 Kafka的记集器（ Reco dACCUl\'lUlato ）负责缓存生产者客户端产生的消息，发送线程（ Sende ）负责读取集器的批过网络发送给服务端为了保证客户端络请求快速应， Kafka 用选择器（ Selecto 络连接读写理，使网络连接（ Netwo kCl i.ent ）处理客户端络请求

追加消息到记录收集器时按照分区进行分组，并放到batches集合中，每个分区的队列都保存了将发送到这个分区对应节点上的记录，客户端的发送线程可只使用 Sende 线程迭 batches的每个分区，获取分区对应的主剧本节点，取出分区对应的列中的批记录就可以发送消息了

消息发送线程有两种消息发送方式按照分区直接发送按照分区的目标节点发迭假设有两台服务器，题有个分区，那么每台服务器就有个分区，消息发送线程迭代batches的每个分接往分区的主副本节点发送消息，总共会有个请求所示，我先按照分区的主副本节点进行分组，属于同个节点的所有分区放在一起，总共只有两个请求做法可以大大减少网络的开销

消息系统由生产者存储系统和消费者组成章分析了生产者发送消息给服务端的过程，本章分析消费者从服务端存储系统读取生产者写入消息的过程首先我来了解消费者的些基础知识

作为分布式的消息系统， Kafka支持多个生产者和多个消费者，生产者可以将消息发布到集群中不同节点的不同分区上；「肖费者也可以消费集群中多个节点的多个分区上的消息写消息时，多个生产者可以到同个分区读消息时，如果多个消费者同时读取个分区，为了保证将日志文件的不同数据分配给不同的消费者，需要采用加锁同步等方式，在分区级别的日志文件上做些控制

相反，如果约定“同个分区只可被个消费者处理”，就不需要加锁同步了，从而可提升消费者的处理能力而且这也并不违反消息的处理语义：原先需要多个消费者处理，现在交给一个消费者处理也是可以的 3- 给出了种最简单的消息系统部署模式，生产者的数据源多种多样，它们都统写人Kafka集群处理消息时有多个消费者分担任务，这些消费者的处理逻辑都相同，每个消费者处理的分区都不会重复

因为分区要被重新分配，分区的所有者都会发生变，所以在还没有重新分配分区之前所有消费者都要停止已有的拉取钱程同时，分区分配给消费者都会在ZK中记录所有者信息，所以也要先删ZK上的节点数据只有和分区相关的所有者拉取线程都释放了，才可以开始分配分区

如果说在重新分配分区前没有释放这些信息，再平衡后就可能造成同个分区被多个消费者所有的情况比如分区Pl 原先归消费者所有，如果没有释放拉取钱程和ZK节点，再平衡后分区Pl 被分配给消费者了，这样消费者和消费者就共享了分区Pl ，而这显然不符合 fka 中关于“一个分区只能被分配给个消费者”的限制条件执行再平衡操作的步骤如下

如果是协调者节点发生故障，服务端会有自己的故障容错机制，选出管理消费组所有消费者的新协调者节，点消费者客户端没有权利做这个工作，它能做的只是等待一段时间，查询服务端是否已经选出了新的协调节点如果消费者查到现在已经有管理协调者的协调节点，就会连接这个新协调节，哉由于这个协调节点是服务端新选出来的，所以每个消费者都应该重新连接协调节点

消费者重新加入消费组，在分配到分区的前后，都会对消费者的拉取工作产生影响消费者发送“加入组请求”之前要停止拉取消息，在收到“加入组响应”中的分区之后要重新开始拉取消息时，为了能够让客户端应用程序感知消费者管理的分区发生变化，在加入组前后，客户端还可以设置自定义的“消费者再平衡监听器”，以便对分区的变化做出合适的处理

以上是关于一文解密Kafka，Kafka源码设计与实现原理剖析，真正的通俗易懂的主要内容，如果未能解决你的问题，请参考以下文章

Kafka设计解析- Exactly Once语义与事务机制原理

Kafka高级设计和架构,一文深化理解

一文搞懂Kafka的技术原理和关键术语概念

一文读懂kafka消息拉取机制｜线程拉取模型

Kafka Producer 实现源码分析

Kafka核心设计与实践原理总结：进阶篇