kafka专栏针对kafka的简单介绍

Posted 字母哥哥

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了kafka专栏针对kafka的简单介绍相关的知识,希望对你有一定的参考价值。

一、Kafka简介

Kafka 是由Linkedin公司开发的一款开源的用于实时流式数据处理的平台,也可以说是一款具有分布式、多分区、多副本、多生产者及消费者的消息队列中间件。

关于kafka更多的名词堆砌式的介绍,我就不多说了,也没有太多实际的意义。

二、Kafka 的特性

  • 高吞吐、低延迟:kafka 处理数据的速度可以达到每秒几百万条(数据处理速度主要受每条数据的大小影响),数据传递的延迟最低可以达到几毫秒。kakfa之所以能做到这点,是因为
    • 实现了零拷贝避免了从内核空间与用户空间的数据复制。
    • kafka数据顺序写入磁盘,从而避免随机写磁盘寻址导致时间上的浪费。之所以能够顺序写盘,是因为kafka文件不提供数据寻址删除的能力。
    • 有效的数据压缩并减少 I/O 延迟
    • 数据生产者采用数据批量发送的方式,而不是逐条发送至kafka服务端
  • 数据持久性、可靠性:kafka接收到的数据会进行持久化的保存到磁盘上,并且存在多副本的备份机制,所以一定程度上保证了数据持久性、可靠性。
  • 高可用容错性:kafka将消息分成多个主题(topic

以上是关于kafka专栏针对kafka的简单介绍的主要内容,如果未能解决你的问题,请参考以下文章

Kafka剖析:Kafka背景及架构介绍

Kafka KSQL入门

Kafka架构及基本原理简析

美光专栏 | 利用闪存存储提升 Apache Kafka 的性能

kafka专栏核心概念篇-broker主题分区消费者组分区副本

一文学会基于发布订阅模式的消息队列Kafka的安装部署和基本使用