蚂蚁二面,面试官问我零拷贝的实现原理,当场懵了…
Posted 蒙娜丽莎的Java
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了蚂蚁二面,面试官问我零拷贝的实现原理,当场懵了…相关的知识,希望对你有一定的参考价值。
“狼哥,面试又跪了,碰到了知识盲区” “哪个?” “一面还可以,二面面试官问我零拷贝的原理,懵逼了…这块内容没去研究过” “哦,这个知识点,我之前应该有讲过,你没注意到?” “这东西工作中用不到,可能被我忽略了” “啧啧啧…” “哎,有空和我讲讲?”
“先从简单开始,实现下这个场景:从一个文件中读出数据并将数据传到另一台服务器上?”
“为啥写这个?”
“你先写”
“行…”
1分钟后
“我写了伪代码”
1. `File.read(file, buf, len);` 2. `Socket.send(socket, buf, len);`
“这里涉及到了几次数据拷贝?”
“2次?磁盘拷贝到内存,内存拷贝到Socket?”
“emmm,怪不得挂了,不冤”
“这种方式一共涉及了4次数据拷贝,知道用户态和内核态的区别吗?”
“了解”
“行,文字有点干瘪,你先看这个图”
1、应用程序中调用 read()
方法,这里会涉及到一次上下文切换(用户态->内核态),底层采用DMA(direct memory access)读取磁盘的文件,并把内容存储到内核地址空间的读取缓存区。
2、由于应用程序无法访问内核地址空间的数据,如果应用程序要操作这些数据,得把这些内容从读取缓冲区拷贝到用户缓冲区。 read()
调用的返回引发一次上下文切换(内核态->用户态),现在数据已经被拷贝到了用户地址空间缓冲区,如果有需要,可以操作修改这些内容。
3、我们最终目的是把这个文件内容通过Socket传到另一个服务中,调用Socket的 send()
方法,又涉及到一次上下文切换(用户态->内核态),同时,文件内容被进行第三次拷贝,这次的缓冲区与目标套接字相关联,与读取缓冲区无关。
4、 send()
调用返回,引发第四次的上下文切换,同时进行第四次拷贝,DMA把数据从目标套接字相关的缓存区传到协议引擎进行发送。
“整个过程中,过程1和4是由DMA负责,并不会消耗CPU,只有过程2和3的拷贝需要CPU参与,整明白了?”
“我消化一下…”
半小时后…
“狼哥,感觉这个过程中好几次的拷贝都是多余的,很影响性能啊”
“对,所以才有了零拷贝技术”
“具体咋实现?”
“慢慢来,如果在应用程序中,不需要操作内容,过程2和3显然是多余的,如果可以直接把内核态读取缓存冲区数据直接拷贝到套接字相关的缓存区,是不是可以达到目的?”
这种实现,可以有以下几点改进:
-
上下文切换的次数从四次减少到了两次
-
拷贝次数从四次减少到了三次(其中DMA copy 2次,CPU copy 1次)
“怎么实现?”
“在Java中,FileChannel的transferTo() 方法可以实现这个过程,该方法将数据从文件通道传输到给定的可写字节通道, 上面的 file.read()
和 socket.send()
调用动作可以替换为 transferTo()
调用”
1. `publicvoid transferTo(long position, long count, WritableByteChannel target);`
在 UNIX 和各种 Linux 系统中,此调用被传递到 sendfile()
系统调用中,最终实现将数据从一个文件描述符传输到了另一个文件描述符。
“这样确实改善了很多,但还没达到零拷贝的要求(还有一次cpu参与的拷贝),还有其它黑技术?”
“对的,如果底层网络接口卡支持收集操作的话,就可以进一步的优化。”
“怎么说?”
在 Linux 内核 2.4 及后期版本中,针对套接字缓冲区描述符做了相应调整,DMA自带了收集功能,对于用户方面,用法还是一样,只是内部操作已经发生了改变:
具体过程:
1、transferTo() 方法使用 DMA 将文件内容拷贝到内核读取缓冲区。
2、避免了内容的整体拷贝,只把包含数据位置和长度信息的描述符追加到套接字缓冲区,DMA 引擎直接把数据从内核缓冲区传到协议引擎,从而消除了最后一次 CPU参与的拷贝动作。
【这里想说,因为自己也走了很多弯路过来的,所以才下定决心整理,收集过程虽不易,但想到能帮助到一部分自学java 的人,心里也是甜的!有需要的伙伴请点㊦方】↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
零拷贝的实现原理
https://www.jianshu.com/p/2581342317ce
"狼哥,面试又跪了,碰到了知识盲区"
"哪个?"
"一面还可以,二面面试官问我零拷贝的原理,懵逼了...这块内容没去研究过"
"哦,这个知识点,我之前应该有讲过,你没注意到?"
"这东西工作中用不到,可能被我忽略了"
"啧啧啧..."
"哎,有空和我大概讲讲?"
"先从简单开始,实现下这个场景:从一个文件中读出数据并将数据传到另一台服务器上?"
"为啥写这个?"
"你先写"
"行..."
1分钟后
"我写了伪代码"
File.read(file, buf, len);
Socket.send(socket, buf, len);
"这里涉及到了几次数据拷贝?"
"2次?磁盘拷贝到内存,内存拷贝到Socket?"
"emmm,怪不得挂了,一点不冤。"
"这种方式一共涉及了4次数据拷贝,知道用户态和内核态的区别吗?"
"了解"
"行,文字有点干瘪,你先看这个图"
1、应用程序中调用read()
方法,这里会涉及到一次上下文切换(用户态->内核态),底层采用DMA(direct memory access)读取磁盘的文件,并把内容存储到内核地址空间的读取缓存区。
2、由于应用程序无法读取内核地址空间的数据,如果应用程序要操作这些数据,必须把这些内容从读取缓冲区拷贝到用户缓冲区。这个时候,read()
调用返回,且引发一次上下文切换(内核态->用户态),现在数据已经被拷贝到了用户地址空间缓冲区,这时,如果有需要,应用程序可以操作修改这些内容。
3、我们最终目的是把这个文件内容通过Socket传到另一个服务中,调用Socket的send()
方法,这里又涉及到一次上下文切换(用户态->内核态),同时,文件内容被进行第三次拷贝,被再次拷贝到内核地址空间缓冲区,但是这次的缓冲区与目标套接字相关联,与读取缓冲区没有半点关系。
4、send()
调用返回,引发第四次的上下文切换,同时进行第四次的数据拷贝,通过DMA把数据从目标套接字相关的缓存区传到协议引擎进行发送。
"在整个过程中,过程1和4是由DMA负责,并不会消耗CPU,只有过程2和3的拷贝需要CPU参与,整明白了?"
"我消化一下..."
半小时后...
"狼哥,这个过程,感觉好几次的数据拷贝都是多余的,很影响性能啊"
"对,所以才有了零拷贝技术"
"具体咋实现?"
"慢慢来,如果在应用程序中,不需要操作内容,过程2和3就是多余的,如果可以直接把内核态读取缓存冲区数据直接拷贝到套接字相关的缓存区,是不是可以达到优化的目的?"
这种实现,可以有以下几点改进:
- 上下文切换的次数从四次减少到了两次
- 数据拷贝次数从四次减少到了三次(其中DMA copy 2次,CPU copy 1次)
"怎么实现?"
"在Java中,正好FileChannel的transferTo() 方法可以实现这个过程,该方法将数据从文件通道传输到给定的可写字节通道, 上面的file.read()
和 socket.send()
调用动作可以替换为 transferTo()
调用"
public void transferTo(long position, long count, WritableByteChannel target);
在 UNIX 和各种 Linux 系统中,此调用被传递到 sendfile()
系统调用中,最终实现将数据从一个文件描述符传输到了另一个文件描述符。
"确实改善了很多,但还没达到零拷贝的要求,还有其它黑技术吗?"
"对的,如果底层网络接口卡支持收集操作的话,就可以进一步的优化。"
"怎么优化?"
在 Linux 内核 2.4 及后期版本中,针对套接字缓冲区描述符做了相应调整,DMA自带了收集功能,对于用户方面,用法还是一样的,但是内部操作已经发生了改变:
- 第一步,transferTo() 方法引发 DMA 将文件内容拷贝到内核读取缓冲区。
- 第二步,把包含数据位置和长度信息的描述符追加到套接字缓冲区,避免了内容整体的拷贝,DMA 引擎直接把数据从内核缓冲区传到协议引擎,从而消除了最后一次 CPU参与的拷贝动作
作者:占小狼
链接:https://www.jianshu.com/p/2581342317ce
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
以上是关于蚂蚁二面,面试官问我零拷贝的实现原理,当场懵了…的主要内容,如果未能解决你的问题,请参考以下文章
蚂蚁面试官:Zookeeper 的选举流程是怎样的?我当场懵逼了。。。