直播 | TalkingData的Spark On Kubernetes实践

Posted 分布式实验室

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了直播 | TalkingData的Spark On Kubernetes实践相关的知识,希望对你有一定的参考价值。

分享时间 :5月8日 20:30


分享主题:TalkingData的Spark On Kubernetes实践


分享人介绍徐蓓,TalkingData云计算架构师,负责云计算、OpenStack、Kubernetes和容器平台的研发与架构。曾在HP、Face++等公司任职,从事云计算研发5年有余。同时也是OpenStack与Kubernetes的contributor。崇尚工程师文化,以目的为导向,致力于推动技术落地与实践。


分享摘要:众所周知,Spark作为快速、通用的数据处理引擎,已经成为大数据计算的事实标准。 而计算作业的资源分配和调度是Spark集群的重中之重。在TalkingData的计算资源平台化过程中,我们使用Kubernetes作为Spark的资源调度管理,利用Kubernetes的原生调度、资源配额、Namespace和Admission Controller,为用户提供了可租户隔离、动态伸缩和即拿即用的大数据计算平台。


主要内容:

  • 如何部署可用于生产的Kubernetes集群

  • Spark与Kubernetes集成

  • 如何实现租户与资源隔离

  • Spark On Kubernetes待解决的问题


分享群:DockOne技术交流微信群



以上是关于直播 | TalkingData的Spark On Kubernetes实践的主要内容,如果未能解决你的问题,请参考以下文章

今日直播 | 揭秘数据可视化

talkingdata比赛分析

阿里大数据云原生化实践,EMR Spark on ACK 产品介绍

31页PPT:基于Spark的移动大数据挖掘

基于SparkNoSQL的实时数据处理实践

技术专栏丨基于SparkNoSQL的实时数据处理实践(下)