10月29日社区直播Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析

Posted Apache Spark技术交流社区

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了10月29日社区直播Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析相关的知识,希望对你有一定的参考价值。

主题:

Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析

时间:

10月29日 19:00

观看方式:

扫描下方二维码进钉钉群
或者登陆直播间(即回看链接)
https://developer.aliyun.com/live/245610

讲师:

张建,英特尔亚太研发有限公司大数据部门的软件工程经理,专注于大数据和机器学习中存储方案优化

议题介绍:

Spark Shuffle RPMem扩展提供了一个基于PMem 和RDMA 来加速Shuffle的方案,它采用PMem 作为Shuffle的存储介质,利用PMDK 用户态编程库进行数据读写,减小用户态、内核态切换与文件系统开销;用基于RDMA网络协议异构的传输层实现高性能数据传输;还将RDMA直接注册在PMem上,减少内存拷贝。
本次直播介绍如何利用持久化内存与高性能RDMA 网络来加速Spark Shuffle。


以上是关于10月29日社区直播Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析的主要内容,如果未能解决你的问题,请参考以下文章

直播预告:R语言初级免费培训班(2020年7月1011日)

5 月 28 日 - 29 日阿里云峰会视频云专场直播预告

Hadoop与 Spark中的Shuffle之区别与联系

鸿蒙社区一周年庆典特别直播·邀请函

精彩回顾丨TEACHAIN全球社区AMA:《TeaChain商业价值》

直播回放丨JumpServer开源堡垒机跨年漫谈会