真正源于产业实践的深度学习框架丨PaddlePaddle年终回顾
Posted 百度AI
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了真正源于产业实践的深度学习框架丨PaddlePaddle年终回顾相关的知识,希望对你有一定的参考价值。
深度学习框架如同智能时代的“发电机”,让人工智能技术更快速地普及到各行各业,推动融合创新,成为智能时代最重要的基础设施。
PaddlePaddle 作为目前国内唯一功能完备的深度学习框架,经过2018年的快速成长,初具模型领先、性能优越、易学易用的技术特色,以及工业场景下的领先优势。
下面我们来盘点一下 PaddlePaddle 2018年的成长之路。
核心发布
1、Paddle Fluid 1.0发布 —— 核心框架走向成熟
7月4日 Paddle Fluid V0.14.0发布——提供从数据预处理到模型部署在内的深度学习全流程的底层能力支持。官方首次开源 CV/NLP/语音/强化学习等10个业界领先的模型。
10月12日 Paddle Fluid V1.0稳定版本发布——提供更稳定、向后兼容的 API。易用性大幅提升。提供 Mac OS 下的多种安装方式,新增对 Python3.5 的支持。并开源8个 CV、NLP 方向主流模型。
11月1日 Paddle Fluid V1.1 发布——支持千亿规模稀疏参数大规模多机异步训练。移动端预测新增 MaliGPU、Adreno GPU、FPGA 等硬件支持。开源5个推荐领域模型,大幅优化 CV、NLP 模型的训练速度和显存占用。
12月8日 Paddle Fluid V1.2 发布——CPU 多机异步训练升级包括 worker 异步并发和 IO、通信优化在内多项功能,整体吞吐大幅提升。支持 python3.6 及以上全版本。模型库新增图像分类任任务的预训练模型、语言模型任务新增基于 cudnn 的 LSTM 实现、分布式 word2vec 模型。
2、PaddlePaddle Suite - 技术全面领先的深度学习全功能套件
PaddlePaddle3.0 升级为全面的深度学习开发套件,在核心框架基础上,开放 VisualDL、PARL、AutoDL、EasyDL、AIStudio 等一整套的深度学习工具组件和服务平台,满足不同层次的深度学习开发者的开发需求。具备强大支持工业级应用的能力,已经被中国企业广泛使用,并拥有活跃的开发者社区生态。
三大技术特色
1、深耕工业场景,打造官方支持模型最多的深度学习框架
基于百度多年的工业应用经验,以及百度生态伙伴的人工智能解决方案实践,PaddlePaddle 为企业提供44个经过工业场景验证的官方模型,涵盖视觉、NLP、语音和推荐等 AI 核心技术领域,成为官方支持模型最多的深度学习框架。
2、基于 PaddlePaddle 开源的多个百度国际竞赛获奖模型:
PyramidBox 模型 2018年3月在世界最权威的人脸检测公开评测集 WIDER FACE 的三项评测子集 Easy、Medium 和 Hard 中均获得世界第一。
基于 Faster R-CNN 的多模型,在 Google AI Open Images-Object Detection Track 比赛中,从全球450多支参赛队伍中脱颖而出,获得世界第一。
PaddlePaddle 强化学习框架 PARL 获得 NeurIPS2018 的强化学习赛事 AI for Prosthetics Challenge 竞赛冠军。
3、源于业务实践,输出业界最强的超大规模并行深度学习能力
基于百度海量规模的业务场景实践,PaddlePaddle 同时支持稠密参数和稀疏参数场景的超大规模深度学习并行训练,支持千亿规模参数、数百个几点的高效并行训练,提供最为领先的深度学习并行技术。
4、追求极致性能,推出移动端高速推理引擎
Paddle Mobile 提供深度学习落地嵌入式移动端平台的能力。针对 ARM CPU、ios GPU、Mali GPU、Adreno GPU、FPGA、树莓派、RK339等多个硬件平台优化,性能高、体积小的优势。服务于包括手机百度、简单搜索在内的多款 APP。在手机端实现单帧多目标检测耗时60 ms 以内,主要物体检测准确率和召回率均在95%以上。
完善的服务平台和配套组件
1、基于 PaddlePaddle 的深度强化学习框架 PARL 发布,夺冠 NeurIPS2018
PARL 深度强化学习框架,具有高可扩展性、可复现性和可复用性,强大的大规模并行化和稀疏特征的支持能力。覆盖 DQN、DDQN、Dueling DQN、DDPG、PPO 等主流强化学习算法。支持百亿级别数据或特征的训练,基于 PARL 可同时通过8块 GPU 拉动近20000个 CPU 节点运算。在 NeurIPS 2018赛事中将需要近5个小时迭代一轮的 PPO 算法加速到不到1分钟,相对单机运算加速比高达几百倍。
2、让深度学习来设计深度学习,AutoDL2.0 设计的网络超过人类专家
AutoDL 2018年正式发布V1.0、V2.0,包含网络结构自动化设计、迁移小数据建模、适配边缘计算三个部分,能够自动进行深度学习网络的设计、迁移、以及适配,批量化生产模型。在 CIFAR 10数据集,Auto DL 2.0设计的图像分类网络正确率达到 98%,效果全面超过人类专家。
3、EasyDL 零基础深度学习定制化训练和服务平台
EasyDL 为零算法基础的开发者提供高精度 AI 模型定制服务。只需少量数据即可得到优质业务模型,快速验证应用场景。2018年,EasyDL 从V3.0迭代升级至V5.0,逐步开放并完善定制图像识别、声音分类识别、文本分类识别等能力,累计超过2万个模型在零售、工业、医疗、安防等多个行业中落地应用。
4、AI Studio:一站式深度学习开发实训平台作为集合了 AI 教程、代码环境、算法算力和数据集的一站式实训平台,汇聚顶尖深度学习开发者,快速帮助用户掌握深度学习开发技能。底层预装 PaddlePaddle 框架及 VisualDL 等深度学习组件,大大提高开发者学习与开发的便捷性,混合调度 CPU 和 GPU 的资源,提升训练速度。AIStudio 共正式发布V1.0、V1.1、V1.2三个版本,主要有项目、数据集、比赛、GPU 集群训练和模型在线预测功能。
黄埔学院,革新者来
百度联合国家深度学习技术及应用国家工程实验室共同打造“黄埔学院”,我们秉承”服务于行业,服务于人才”的标准,项目组通过几个月的招募与筛选,日日夜夜的评估与努力,最终选出业内35位深度学习专家,共同见证黄埔学院第一期开学典礼——首席 AI 架构师的课堂。“经世致用,融会贯通,黄埔学院,革新者来”,这十六个字正代表了黄埔学院的治学理念以及愿景。我们希望技术不停留在实验室,不停留在研究院,而是能真正的走出去,为这个世界、这个时代创造实实在在的价值。
2019,未来可期
2019年,PaddlePaddle 将继续以优化开发者体验、节约开发者时间为己任,巩固技术领先优势,深入企业场景,在应用落地的各个环节提供更便捷、更安全、更高效的深度学习技术服务。
继续降低深度学习技术的应用门槛,将超大规模并行深度学习、强化学习等业界领先的技术打造为人人可用的通用深度学习。
大力发展企业生态,通过应用场景深度对接,为企业提供快速咨询通道、企业内部培训、专项技术优化、联合开发支持的全方位服务。
持续扩大教育生态,通过百度产学合作协同育人项目、TechDay 公开课、深度学习实战课、黄埔学院等行业顶级的技术交流活动,为开发者提供从深度学习入门到企业应用的一站式服务。
点击“阅读原文”了解更多。
以上是关于真正源于产业实践的深度学习框架丨PaddlePaddle年终回顾的主要内容,如果未能解决你的问题,请参考以下文章
首个完整支持中文文档的深度学习框架——百度PaddlePaddle API文档简介