Apache Kafka 架构和相关概念

Posted 2020-12-18 xjzcz

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Apache Kafka 架构和相关概念相关的知识，希望对你有一定的参考价值。

Apache Kafka 架构和相关概念

Apache Kafka 是一款开源的分布式消息引擎系统

消息引擎的同类

ActiveMQ
RabbitMQ
WebSphere MQ
Rocket MQ
JMS仅仅是一组 API 协议

消息引擎的作用

削峰填谷

缓冲上下游瞬时突发流量，使其更平滑.特别是对于那种发送能力很强的上游系统，如果没有消息引擎的保护，“脆弱”的下游系统可能会直接被压垮导致全链路服务“雪崩”。
但是，一旦有了消息引擎，它能够有效地对抗上游的流量冲击，真正做到将上游的“峰”填满到“谷”中，避免了流量的震荡

解耦

使发送方与接收方松耦合,仅以协议的方式进行通讯,简化了开发.

消息引擎使用方式

点对点

也叫消息队列,每个消息只能被一个下游的消费者消费.

把消息发给多个处理者,方便扩展处理量,同时也意味着,当一个消费者消费了这条消息,这条消息就不存在了.别人无法消费

发布/订阅

把消息广播给每个处理者.

由于每条消息都会传递给每个订阅者，因此无法扩展处理。kafka的consumerGroup同时支持上述这两种方式.

Kafka模型的优势在于，每个主题都具有这两个属性-可以扩展处理范围，并且是多用户的-无需选择其中一个。

KAFKA 拓扑结构图

技术图片

KAFKA 结构图

KAFKA 概念

Broker

Broker 负责接收和处理客户端发送过来的请求，以及对消息进行持久化, 一个 Kafka集群由多个
Broker 组成. 也可以理解为 KAFKA 服务器

Client

分为生产者和消费者

producer
向主题发布消息的客户端应用程序称为生产者（Producer），生产者程序通常持续不断地向一个或多个主题发送消息.

生产者负责选择将记录分配给主题中相应的分区。可以简单地以轮循方式完成此操作，也可以根据某些语义分区功能（例如基于记录中的某些键）完成此操作。
2. Consumer 订阅这些主题消息的客户端应用程序就被称为消费者（Consumer）

消费者存在于消费者组中，主题的每条记录都会传递到订阅消费者组中的一个消费者实例。使用者实例可以位于单独的进程中，也可以位于单独的机器上。

Topic

发布订阅的对象是主题（Topic）,可以是某个业务,某个应用甚至某类数据的逻辑分类.

Partitioning

每个分区都是有序的，不变的记录序列，这些记录连续地追加到结构化的提交日志中.分区中的每个记录均分配有一个称为偏移的顺序ID号，该ID
唯一地标识分区中的记录。

Kafka中的分区机制指的是将每个主题划分成多个分区（Partition），每个分区是一组有序的消息日志。生产者生产的每条消息只会被发送到一个分区中，也就是说如果向一个双分区的主题发送一条消息，这条消息要么在分区
0 中，要么在分区 1 中。

每个主题下可以有多个分区.

分区的作用:

提供扩展性, TOPIC 下可以增加分区
提供并行性. 方便多个消费都并行处理

Replication

备份的思想很简单，就是把相同的数据拷贝到多台机器上，而这些相同的数据拷贝在 Kafka 中被称为副本（Replica）。

副本的数量是可以配置的，这些副本保存着相同的数据，但却有不同的角色和作用。Kafka 定义了两类副本：领导者副本（Leader Replica）和追随者副本（Follower Replica）。前者对外提供服务，这里的对外指的是与客户端程序进行交互；而后者只是被动地追随领导者副本而已，不能与外界进行交互。

副本的作用:

保证了 KAFKA 容错能力