机器学习平台搭建及应用分享

Posted DataFunTalk

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习平台搭建及应用分享相关的知识,希望对你有一定的参考价值。

12月20日,9:00-12:40,由京东九数算法平台负责人朱小坤老师出品的DataFunTalk年终大会——机器学习论坛,将邀请来自小米、京东、旷视、58同城等公司的5位嘉宾,就机器学习相关主题进行分享。本次会议全程直播详细信息如下:

01

论坛日程

论坛名称
机器学习论坛
论坛时间
12月20日,09:00-12:40
论坛出品

朱小坤 京东 九数算法平台负责人

分享时间
分享内容
09:00-09:40 vGPU应用机器学习平台
小米人工智能软件工程师
纪少敏
09:45-10:25 九数算法平台探索与创新实践
京东算法工程师
牛文杰
10:30-11:10 旷视Brain++平台训练数据供给系统的架构和设计
旷视科技高级研发工程师
杨阳
11:15-11:55 京东超大规模联邦学习平台 ( 9N-FL )在电商营销领域的实践
京东资深算法专家
杜宝坤
12:00-12:40 58深度学习平台在提高模型推理性能和 GPU 使用率上的实践
58同城 AI Lab 架构师
陈兴振
02
论坛报名

识别二维码,免费报名
03
详细介绍
出品人:
机器学习平台搭建及应用分享

朱小坤

京东 | 九数算法平台负责人
出品人简介: 资深技术专家。国内网络游戏反外挂领域的先行者,在国内首个道具收费的爆款游戏《热血江湖》中,成功控制外挂,完成近乎挑战的目标,为产品的成功奠定了技术基础。加入京东零售以来,一直从事算法平台相关工作,从零打造了京东零售的“九数算法平台”,平台聚焦易用性、高性能,为算法人员提供了一站式算法解决方案,广泛赋能京东零售、京东数科、京东云、京东物流、京东健康等,极大提高了算法迭代效率,推动了业务的高速增长。
分享嘉宾:

机器学习平台搭建及应用分享

纪少敏

小米人工智能 | 软件开发工程师
演讲者简介:纪少敏,小米AI Lab核心研发。在小米从事机器学习平台的开发及公司内各智能业务在平台的落地。已推动NLP、视觉、语音等智能业务组在机器学习平台进行训练和推理。
演讲议题:vGPU应用机器学习平台
演讲议题介绍:机器学习平台承接着公司人工智能部门大多数的机器学习任务和推理服务,这些任务依赖GPU的高性能计算,本演讲主要介绍使用虚拟GPU(vGPU)来加速任务训练、推理以及节省GPU成本。
听众收益:在大规模的机器学习平台中,通过vGPU加速训练和推理, 同时扩展Kubernetes调度,将vGPU技术应用到Kubernets集群,多个实例使用相同物理GPU,节省GPU集群成本。
新技术/实用技术点:虚拟GPU技术、远程GPU技术、GPU池化、GPU显存和算力隔离以及扩展调度。
机器学习平台搭建及应用分享

牛文杰

京东 | 算法工程师
演讲者简介: 牛文杰,京东零售九数算法平台核心研发,从0到1推动了九数算法平台建设,在机器学习框架、分布式计算、集群技术等方面有丰富的经验,并推动了多项技术创新。
演讲议题:九数算法平台探索与创新实践
演讲议题介绍:当前,大数据和人工智能技术正助推各个领域迅猛发展,零售场景中各算法业务同样依赖更大的数据规模和更高的算法复杂度来助推业务增长。在此背景下,我们介绍算法平台如何落地,并面向业务痛点,通过各种技术创新来提高算法开发和业务迭代效率。
听众收益:
(1) 基于Kubernetes如何搭建业务平台。
(2) 集群技术如何提高模型训练效率,助推算法迭代。
(3) 分布式机器学习训练如何做到完全容错,自动处理可恢复性故障。
新技术/实用技术点:集群加速、分布式容错、容器调度、降本增效。

机器学习平台搭建及应用分享

杨阳

旷视科技 | 高级研发工程师
演讲者简介: 旷视科技Brain++系统的存储系统负责人,带领团队自研了 100 PiB 规模的对象存储系统,支撑高速训练的分布式缓存,支撑数据增广横向扩展的解决方案。
演讲议题:旷视Brain++平台训练数据供给系统的架构和设计
演讲议题介绍:根据旷视科技经验,介绍旷视在深度学习训练系统的数据系统优化历程。
听众收益:了解旷视内部训练流程中的数据流。
新技术/实用技术点:训练数据缓存系统,数据增广横向扩展方案

机器学习平台搭建及应用分享

杜宝坤

京东 | 资深算法专家
演讲者简介: 杜宝坤,京东商业提升事业部-广告质量部-资深算法专家,主要负责营销端的联邦学习以及站外的触发算法。拥有十多年的互联网工作经验,曾经供职于百度、360等多家知名互联网公司。在互联网搜索、推荐与广告等方向的架构与算法方面,有多年的一线开发与项目管理经验,并且成功主导过多个大型项目。2020年在京东零售数据算法通道委员会的指导下,作为项目技术与业务负责人带领团队完成京东超大规模联邦学习框架9N-FL的落地,并且进行技术赋能,与营销媒体端进行合作,取得了不俗的成绩;同时9N-FL也于2020年9月进行开源,回馈社区。 
演讲议题:京东超大规模联邦学习平台(9N-FL)在电商营销领域的实践
演讲议题介绍:对于AI飞速发展的今天来说,大规模的多维度、高质量的数据是其成功的关键要素,也是制约其进一步发展的重要瓶颈。随着大家对数据的重要性与隐私性的认知程度的不断提升,跨组织的数据的合作越来越谨慎,相关隐私法律法规也陆续出台(GDPR),这样就造成了大量了的数据孤岛,无法充分的利用数据进行分析、决策,严重制约了AI的发展。联邦学习在保证数据隐私安全及合法合规的基础上,打破数据孤岛,实现共同建模,共创共赢,将成为未来AI发展的一个重要方向,9N-FL作为联邦学习的整体开源解决方案,也会在未来发挥越来越大的作用。
听众收益:通过了解联邦学习的原理以及解决方案9N-FL,并且结合本公司的业务,进行应用,开辟一个新的业务模式与增长点。
新技术/实用技术点:在隐私保护越来越严格的未来,联邦学习将成为机器学习平台发展的趋势。联邦学习多方联合建模也将成为未来广泛使用的业务模式,充分利用多方大规模的数据共创共赢,加速整个AI产业的发展。

陈兴振

58同城 | AI Lab架构师
演讲者简介: 58同城AI Lab后端架构师,AI平台部负责人,2016年加入58,目前主要负责AI算法平台及周围子系统的建设工作,在58先后负责过推荐系统、智能外呼系统后端架构设计和研发。曾就职于腾讯、中国院计算所等公司。
演讲议题:58深度学习平台如何提高模型推理性能和GPU使用率
演讲议题介绍:58同城深度学习平台是集开发实验、模型训练和推理为一体的一站式算法研发平台,支撑了58同城搜索、推荐、NLP、语音、图像等各类应用。本次分享将首先介绍如何利用Nvidia和Intel的开源组件提升深度学习模型在GPU和CPU上的推理性能,然后再分享围绕提升平台GPU使用率所进行的GPU虚拟化技术应用和模型混部等工作。
听众收益:了解深度学习模型推理性能优化方法以及如何提升平台GPU利用率
新技术/实用技术点:GPU虚拟化技术应用,Nvidia推理引擎TIS应
04
论坛报名

识别二维码,免费报名

▽点击阅读原文,直达报名页!

以上是关于机器学习平台搭建及应用分享的主要内容,如果未能解决你的问题,请参考以下文章

bilibili基于 Flink 的机器学习工作流平台在 b 站的应用

Alink:基于Flink的机器学习平台

分享从问题到应用:人工智能与机器学习原理及应用

阿里云机器学习平台——PAI平台

机器学习:Azure机器学习模型搭建实验

自然语言处理及词向量模型介绍