Kafka的零拷贝技术

Posted SH HOME

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Kafka的零拷贝技术相关的知识,希望对你有一定的参考价值。

kafka中的消费者在读取服务端的数据时,需要将服务端的磁盘文件通过网络发送到消费者进程,网络发送需要经过几种网络节点。如下图所示:



传统的读取文件数据并发送到网络的步骤如下:
(1)操作系统将数据从磁盘文件中读取到内核空间的页面缓存;
(2)应用程序将数据从内核空间读入用户空间缓冲区;
(3)应用程序将读到数据写回内核空间并放入socket缓冲区;
(4)操作系统将数据从socket缓冲区复制到网卡接口,此时数据才能通过网络发送。

通常情况下,Kafka的消息会有多个订阅者,生产者发布的消息会被不同的消费者多次消费,为了优化这个流程,Kafka使用了“零拷贝技术”,如下图所示:



“零拷贝技术”只用将磁盘文件的数据复制到页面缓存中一次,然后将数据从页面缓存直接发送到网络中(发送给不同的订阅者时,都可以使用同一个页面缓存),避免了重复复制操作。

如果有10个消费者,传统方式下,数据复制次数为4*10=40次,而使用“零拷贝技术”只需要1+10=11次,一次为从磁盘复制到页面缓存,10次表示10个消费者各自读取一次页面缓存。


以上是关于Kafka的零拷贝技术的主要内容,如果未能解决你的问题,请参考以下文章

Kafka 和 MySQL 都在使用的零拷贝技术!

Linux中的零拷贝技术

NettyKafka中的零拷贝技术到底有多牛?

深入浅出操作系统的零拷贝

深入探秘 NettyKafka 中的零拷贝技术!

Netty零拷贝