问策︱开源人工智能有何目的

Posted 国际金融报

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了问策︱开源人工智能有何目的相关的知识,希望对你有一定的参考价值。


◎ 本报记者 陈莎莎


  人工智能是前沿话题,但是人工智能的发展还是初级阶段,好比处于原始社会的医学。人工智能的研究范围很广,几大互联网巨头的研究方向不一,且在各自的研究方向上也只是刚刚开始,还需要几代科学家的共同努力,没有哪家公司有一家独大的技术优势。开放程序源代码,最重要的目的是吸引各路英才研究、测试、改进自家软件,为下一步腾飞收集数据。

  

  截至目前,脸书(Facebook)、谷歌、微软、IBM先后开源人工智能。所谓,开源,即把程序的源代码开放,任何人都可以随意拿去使用、修改。

  天下无免费的午餐。几大互联网公司此举有何目的?对全球人工智能发展,又会产生什么影响呢?


开源什么


  IBM公司12月7日宣布,将通过Apache软件基金会免费为外部程序员提供System ML(machine learning机器学习)人工智能工具的源代码。IBM开发副总裁罗布·托马斯(Rob Thomas)表示,希望这是System ML广泛普及的第一步。

  据了解,System ML最初由IBM在10年前开发,可以简化开发人员定制机器学习软件的难度。例如,该软件可以帮助银行编写风险建模软件,从而在发现欺诈活动时预先发出警示。目前的版本希望能与另外一个软件配合使用,帮助企业处理来自智能手机或健身手环的大量数据。

  IBM是今年第四家对外开放专有机器学习技术的科技巨头。脸书2月开放了Torch Software人工智能软件的部分内容。谷歌11月开放了TensorFlow系统。该系统可被用于语音识别或照片识别等多项机器深度学习领域,可被运行于由数千台电脑组成的服务器集群或者单一智能手机之上,目前在搜索、照片以及Inbox邮箱应用等产品中均有使用。

  同月,微软也推出了机器学习开源工具包DMTK。该开源程序可以让中小企业用几台电脑,就实现几千台超级电脑的工作——因为人工智能需要处理海量大数据。DMTK的全称是Dstributed Machine Learning Toolkit,即,分布式机器学习工具包。其中一个工具叫LightLDA,是用于大规模主题模型的可扩展、快速、轻量级系统。

  微软表示,“在分布式实现中,做了大量的系统优化使得 LightLDA能够在一个普通计算机集群上处理超大规模的数据和模型。例如,在一个由8台计算机组成的集群上,可以在具有2000亿训练样本的数据集上训练具有100万词汇表和100万个话题(topic)的LDA模型(约1万亿个参数)。”

  微软研究院的小乔治·托马斯(Jr. George Thomas)表示,借助这些工具,开发者可以使用较少的服务器部署大规模的机器学习。


意欲何为


  大公司辛辛苦苦研发的软件,为什么要免费向公众开放呢?

  业内共识是,各家人工智能公司都在积极招募机器学习人才,而开放源代码则可以吸引外部人才参与项目协作,并改进相关技术。他们也有可能从第三方社区中招募一些人才。

  托马斯表示,IBM希望通过开放System ML源代码,吸引更多程序员运用和研究此软件,从而加快这款软件的发展,“我们目前的研发受到预算的限制,所以需要开源,加快创新速度。”

  “中国国内的人工智能研究还没真正开始,所以对人才也没发现有巨大的渴求。我们仍然以传统业务为主,还没听说哪个公司要重点发展人工智能。”BAT一位高管告诉记者。

  谷歌公司在官方网站上表示,谷歌希望通过放出这套系统吸引更多研究人员,为其找到新的用武之地,并进行改进,“TensorFlow尚不完备,还需要调整、修改、扩充。”

  值得注意的是,虽然该系统转为开源,但谷歌留下了能让自家机器学习技术独树一帜的东西:巨量的数据、可以运行该软件的计算机网络,以及一个庞大的人工智能专家团队,可以调整算法。

  英国布里斯托大学的人工智能教授克里斯蒂亚尼尼表示:“谷歌此举并不是昏了头。深度学习不是即插即用,它需要做很多测试、调整和适配工作。”

  谷歌公开自家系统的重要目的之一,是吸引到更多的人工智能专家,来为软件的改进和应用出谋划策,“这类系统有数百万个参数需要调整。如果没有工程师进行这一工作,那么谷歌这次放出的深度学习算法用途就极为有限。”


怎么盈利


  各家公司竞相开源,让各家相互之间也可以使用竞争对手的开源程序。

  谷歌会用微软、IBM、Facebook的人工智能系统,它自己也会被别人用。而且开发者可以把各家开源程序都整合在一起,创造出自己的新系统。

  中国国内巨头互联网公司也会使用谷歌Facebook微软IBM等公司开源的程序,进行修改后变成自己的人工智能程序。但中国国内对人工智能的研究,并不像美国这样火热。“除了百度,国内没有哪个公司把人工智能作为单独事业部。”BAT的技术高管告诉《国际金融报》记者。

  人工智能软件的研发需耗费大量人力物力,那么这些开源软件还能实现商业盈利吗?

  BAT的一位核心技术高管向《国际金融报》记者分析,“就像谷歌安卓系统的开源,用的人多了,周边相关的东西就多了,谷歌可以从其他地方赚钱,比如提供配套服务,比如广告,比如专用设备。只要用的人多,就能赚钱。”

  “其中广告是非常重要的收入来源,谷歌开源的系统与安卓有强相关,用的人多了,只要用的人多,就能赚钱。” 该技术高管告诉记者。“也有可能出硬件设备,用的人多了,可能提供专用设备,比如智能硬件,软件硬件形成更完整的生态系统。”

  不过,该技术高管表示,“人工智能服务的盈利模式还没有清晰的场景,虽然它能改进和提升已有的系统,但光凭机器学习这个服务本身来赚钱,还没有清晰模式。”




以上是关于问策︱开源人工智能有何目的的主要内容,如果未能解决你的问题,请参考以下文章

python和C++语言有何优缺点?哪个更适合人工智能?

Python到底有何特点,成为了人工智能首选语言?

人工智能在未来的战争训练中有何作用

人工智能,机器学习,深度学习,到底有何区别

让「钢铁侠」都担忧的人工智能公司DeepMind,有何特别之处?

云计算,大数据,人工智能三者有何关系?