机器学习框架发展的三大“关键词”在人工智能时代,机器学习框架下接芯片,上承各种应用,被称为是“智能时代的操作系统”。在机器学习中,一般经过数据收集、特征工程、模型建立、模型训练、模型验证等阶段,它是一个往复循环的工程,直到获得满意的模型,并在生产环境中部署模型,在生产中通过数据提供服务。机器学习框架就是帮助机器学习工程师,快速地开发产品和构建算法,并确保其可靠、快速和成规模地工作。中国软件网发现,2020年以来,机器学习中的深度学习框架在发展上呈现出三大趋势:一是开源。软件开源成就了操作系统Linux和安卓,成就了NoSQL数据库和关系型数据库mysql,成就了消息中间件,成就云原生技术中的容器等。同样,开源成就了AI和机器学习。几乎有名的机器学习框架都开源了,也通过开源不断发展壮大。创建开源机器学习平台H2O的H2O.ai的创始人兼CEO Sri Ambati就认为,人工智能软件库和算法都免费提供给开发人员和企业家,使企业能够更容易地尝试人工智能,并建立对人工智能技术更大的信任,这是开源人工智能和机器学习框架发展的根本动力。另外,开源机器学习框架培养了"开源"文化,使企业有更大的自由与开源社区一起创新,并利用同行的想法将机器学习嵌入到其业务中。相比之下,封闭式机器学习应用开发方法往往会抑制增长。它无助于创建反馈循环、解决问题和改进产品、促进急需的人工智能人才的发展,也无法激发对人工智能模型和预测的信任。围绕人工智能和机器学习的开源社区可以通过减少高许可费、共享相关成果,减少对人才的需求等更快的实现目标。开源人工智能社区发展的社区思维,将平衡小组织、大组织、社区之间的力量对比,让每一种组织都可以享受AI的好处。二是融合。PyTorch是当今世界上最受欢迎的机器学习框架,而TensorFlow则是最流行的Ml框架。这两个开源的机器学习框架,分别由Facebook和谷歌提供并开源的,分别拥有各自的拥戴者,但也不可避免的有互补关系。
AWS CEO Andy Jassy2019年演讲在AWS re:Invent 2019 上,AWS CEO Andy Jassy声称,在应用最多的机器学习框架方面,85%的TensorFlow用户在云上的工作负载都运行在亚马逊云科技上,而到了2020年,这一数字达到92%。同时,91%的PyTorch在云上的工作负载都跑在亚马逊云科技,在云上面进行机器学习已经是非常成熟的选择。研发集团的支持与降低应用门槛同步同进。目前来看,不管是那种机器学习框架,在依靠开源社区的基础上,依然有强大的机构研发力量的支持。TensorFlow是谷歌的关键项目。谷歌已投入数百万美元用于研发,以推进机器学习,并将这些能力带到TensorFlow。谷歌正在利用TensorFlow为其许多产品和服务,包括谷歌助手、安卓等服务。在今年上半年,Facebook联手微软宣布推出PyTorch企业支持计划,该计划使服务提供商能够为其客户开发和提供定制的企业级支持。Facebook与微软合作建立的新产品是根据PyTorch企业用户在生产中为关键任务应用开发模型的反馈而创建的。另一个机器学习框架Azure ML Studio允许微软Azure的用户创建和训练模型,随后将这些模型转化为能被其他服务使用的API。在Azure中有大量的算法可供使用。飞桨一直致力于降低用户使用的门槛,既有支持动静统一的核心框架,也有产业级模型库、开发套件和工具组件,以及提高企业生产效率的飞桨企业版等,满足不一样行业、不一样阶段、不一样层次开发者的需要。使用门槛的下降,比如会加快人工智能应用的多样化和规模化,加快了产业智能化的进程。