百度的又一个新开源项目——PaddlePaddle

Posted 1号机器人网

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了百度的又一个新开源项目——PaddlePaddle相关的知识,希望对你有一定的参考价值。


 

国互联网巨头百度公司在深层学习神经网络的运用上取得了很大的进步,主要运用领域包括图像识别,语言翻译,搜索排名以及通过点击广告来进行产品推荐。现在,它准备将以上这些领域先放一放,准备开发另外一些领域。

 

百度,被许多人称为“中国的谷歌”,该公司星期四在北京举办的百度年会上宣布,它准备将本公司工程师使用了多年的人工智能软件平台开源以供大众使用。这个源代码叫做PaddlePaddle。该开源软件的初级版本将于9月30日公布于Github网站上,该代码是基于并行分布式深度学习技术。

 

深层学习是机器学习技术的一个分支,它可以试图模仿人类大脑神经元的工作模式,对声音,图像或其他数据进行处理的一个过程。谷歌,facebook,微软,IBM和其他公司也在这些人工智能神经网络技术的帮助下,处理了大量的复杂数据,取得了很大的突破。

 

在过去两年当中,也不断有一些机器智能技术和深层学习工具开源了。例如facebook的Torch(一个广泛支持机器学习算法的科学计算框架)以及机器视觉科技;谷歌公司也曾开源了TensorFlow(是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。);微软公司的CNTK(是一个统一的深度学习工具包,它通过一个有向图将神经网络描述为一系列计算步骤);以及亚马逊网站的DSSTNE(把 DSSTNE 开源,人类对于深度学习的研究将不止于语言理解及视觉识别,智能搜索和推荐将得到更广泛的研究和讨论。)。除此之外,百度之前开源的另一个框架技术叫做Caffe。

 

百度也开源了其他人工智能代码。但是百度杰出的科学家徐伟,作为这次PaddlePaddle开源的项目负责人,他说道,这个软件有更加广泛的用途,哪怕你不是深层学习领域的专家,也不明白这些人工智能,你同样能够使用,它需要对软件模型进行持久不断的训练。

 

 “这款软件很容易使用,你不是这方面的专家都没关系,你能够轻易地将它用于你的项目当中。”徐伟在一次采访当中说道。“你不需要担心那些复杂的数学公式,也不需要担心如何处理这些数据任务。”(事实上,每一个源代码的公布,都在向大众传达一个观念,就是使用我所开源的这个软件或者技术,会比世面上其他的软件更加容易,更好操作。)

 

然而要想真正地使用好这款软件,当然毫无疑问还是需要一定的知识基础的。但是徐伟说,PaddlePaddle这款软件运用中所需要的代码要远远少于其他的软件。例如,建立一个机器翻译模型,用PaddlePaddle来建立时所需用的代码比普通人工智能平台所需要的代码要少四分之一。并且现有的模型可以被用于新的问题当中,而不需要复杂的方程式。“我们想要帮助人们真正来研发产品。而不是其他一些可有可无的研究。”徐伟谈道。

 

从商业的角度来看,它撇弃了深度学习当中重要的几个工具,可能会让人觉得太不可思议无法理解。但是在这种疯狂做法的背后,其实它还有一个杀手锏,它与其他开源的版本不太一样,其他那些开源项目都是想吸引开发者去为平台创建更多的应用程序,而它更加灵活,容易配置复杂的模型。

 

提到人工智能算法的开源,特别是在百度,其实它最主要的目标就是为了吸引更多深层学习工程师的注意力,因为在当今科技行业里,深层学习工程师是需求量很大的一个群体。“PaddlePaddle开源之后,在很多的人眼中,会觉得百度在这些方面是一个领航者,从而许多优秀的人才会因此而被吸引过来。” 

 

除此之外,这些人工智能算法本身,也经常在深层学习相关领域的一些学术论文中被分享,所以从这个角度来说,算法本身没有什么大的优势。从竞争的角度来说,更加重要的是这些公司所搜集到的数据。“算法并不是最重要的,你能够在这个领域有更大的突破主要是在于你是如何收集以及使用已经被训练过的数据的。” 451研究所的研究总监彼得•克里斯蒂说道。

 

百度首席科学家安德鲁•吴(吴恩达)在百度位于桑尼维尔的大楼中接受采访时这样表示道,“数据是更加重要的天然屏障。”

 

安德鲁•吴几年前曾负责过“Google Brain AI”这个项目,他说,人工智能将会突破公司的AI部门所设定的一切限制,它有巨大的潜力能够在这个过程里诞生更多新型的人工智能技术。

 

PaddlePaddle看起来是为了吸引更多的人工智能人才。它想凭借着这样一种高效又容易运用的源代码让更多的人来体验,想要通过吸引工程师来将该技术运用的范围更加广。

 

开源人工智能软件是迅速形成一个讨论社区的最快的方式,而这样就能让更多的人知道这一软件的存在。克里斯蒂说道,“共享代码是使得人们可以共同聚在一起讨论某个领域问题的快捷方式,同样它还有更大的价值,而不仅仅是代码。”

 

和其他人工智能系统一样,Paddle可以运行于大型的计算机程序当中,它也可以在多机并行的GPU训练平台运行,它能够使用图形处理单元,该单元的并行处理能力可以在深度学习算法上得到充分体现。



以上是关于百度的又一个新开源项目——PaddlePaddle的主要内容,如果未能解决你的问题,请参考以下文章

开源项目 | 百度飞桨(PaddlePaddle)登陆鹏城汇智

百度深度学习开源框架PaddlePaddle发布新版API,简化深度学习编程

前沿|PaddlePaddle开源项目DeepNav“无人船”炼成记

百度PaddlePaddle:

百度paddlepaddle深度学习平台全套入门教程 ‖ 资源

百度正式宣布推出深度学习开源平台PaddlePaddle