干货 | 科技巨头开源的机器学习框架:250万行代码,价值超8000万美元

Posted UHealth健盟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了干货 | 科技巨头开源的机器学习框架:250万行代码,价值超8000万美元相关的知识,希望对你有一定的参考价值。


ID:almosthuman2014



当今的科技公司面对开源几乎都持有开放态度,在谷歌、Facebook 等公司分别支持不同的机器学习框架之后,百度、腾讯和阿里巴巴也纷纷推出了自己的机器学习框架。






作者 | Ben Blume

编译 | 机器之心


随着资源的不断丰富,人工智能的研究门槛正在降低,AI 领域正呈现繁荣的趋势。科技巨头们为开源框架究竟做出了多少贡献?


近日,来自风投机构 Atomico 的 Ben Blume(毕业于剑桥大学)做出了自己的估算,在统计了各家公司和机构推出的 13 款机器学习框架后,他认为这些共计超过 250 万行代码的框架价值超过 8000 万美元。


上周五,谷歌 DeepMind 发布了基于 TensorFlow 的高级框架 Sonnet,一个帮助开发者在 TensorFlow 中快速构建神经网络的开源模块。


这是一个具有重要意义的举措,它意味着来自 DeepMind 二百五十余名顶级工程师的内部技术从此可以被世人所用。从此,所有开发者在面对机器学习问题时将变得更加从容。


事实上,在过去几年里,全世界最大的几家科技公司(包括谷歌、Facebook、微软、IBM、百度、亚马逊、腾讯和阿里巴巴等)和众多大学实验室已经开源了至少 250 万行机器学习平台的代码,这相当于超过 650 名开发者一年的工作量,或 8000 万美元的开发成本。


目前,所有人都可以免费使用这些工具,而其中的很多如 TensorFlow 和 Paddle 都拥有大量的学习资料和范例。因此,它们可以被视为任何想要投身机器学习领域公司令人难以置信的稳固基础。


干货 | 科技巨头开源的机器学习框架:250万行代码,价值超8000万美元

图 | 最受欢迎的几种机器学习框架,以代码行数排序。


开源的大潮还在继续,具有学术背景的研究者和工程师正在推动他们在科技公司雇主不断为开源社区做出贡献。


这种现象引出了一个有关如何安置人才的有趣问题——人工智能的生态系统需要的是所有人才集中在有限几个机构中开展核心问题研究,并不断开源其重要研究成果;还是让所有人才分散到大量小团队中去解决应用方向的问题?


很多早期初创公司都在寻找机器学习人才的时候发现他们难以和谷歌、Facebook 这样的公司竞争,后者通常拥有大量资源,为人工智能研究提供了绝佳环境。但如果大公司拒绝公开自己的研究成果,仅仅为利润考虑,这种「囤积」人才的做法可能会打击整个行业的创新。


幸运的是,目前大多数公司都没有做出这样的选择。通过开源自己的研究,这些公司正在通过向开发者提供构建机器学习业务的基础工具加速自身以及行业的创新步伐。


现在看来效果是显著的,在领英网(LinkedIn)上,已有超过 7000 个职位在要求中提到了上述机构推出的框架。


来自 FirstMark 的 Matt Turck 在最近一篇文章《Firing on All Cylinders: The 2017 Big Data Landscape》中写道:


我们正在目睹新堆栈的出现,其中大数据技术被用于核心数据工程的挑战,机器学习被用于从数据中挖掘价值(以分析、判断或行动的形式)。换句话说:大数据提供管道,人工智能带来智慧。


我们正站在新变革的临界点上:「大数据+人工智能」堆栈强大到几乎可以解决现实世界的任何问题。


即使是目前层出不穷的初级应用看起来也有很大潜力。DeepMind 通过机器学习技术已将谷歌数据中心的冷却系统能耗降低了 40%,显示了强大的能力。除此之外,医疗、农业、物流和公司业务流程等领域都已被机器学习渗透:


●Kheiron 使用计算机视觉分析医疗影像,并自动生成放射成像报告,可节省放射科医师 60% 的时间


●Connecterra 正在使用机器学习分析部署在奶牛身上的传感器传来的数据,识别早期行为,可将产奶量提高 20%


●DigitalGenius 使用机器学习挖掘客户服务数据,以此并向客服人员提供有关回复内容的建议,将生产力提高了大约 30%


干货 | 科技巨头开源的机器学习框架:250万行代码,价值超8000万美元

图 |  经济学中的正常收益率曲线


如果我们认为人工智能的影响遵从正常收益率曲线,那么「成熟度(Maturity)」就是发展人工智能应用的投入,「收益(Yield)」是基于目前技术水平的改进潜力。


令人兴奋的是,目前我们在很多问题上都处于起步阶段,投入获得的回报是丰厚的。在未来十年里,现有机器学习技术的收益曲线将会变得平缓,但目前来看大部分技术都是值得推进的。


虽然机器学习具有光明的前景,需要明确的是,目前构建人工智能和机器学习驱动的公司并不是一件容易的事。


所有初创企业都会面临招聘人才、获取训练数据和进行商业验证这三个挑战。但随着开源社区的繁荣以及更多需求的发掘,其中两个问题都正被解决。良好的创业环境正为企业家、研究者和工程师铺平道路。


-END-


干货 | 科技巨头开源的机器学习框架:250万行代码,价值超8000万美元
相关阅读:


干货 | 科技巨头开源的机器学习框架:250万行代码,价值超8000万美元




干货 | 科技巨头开源的机器学习框架:250万行代码,价值超8000万美元




干货 | 科技巨头开源的机器学习框架:250万行代码,价值超8000万美元








以上是关于干货 | 科技巨头开源的机器学习框架:250万行代码,价值超8000万美元的主要内容,如果未能解决你的问题,请参考以下文章

11月最佳机器学习开源项目Top10!

不到1000行代码,GitHub 1400星,天才黑客开源深度学习框架tinygrad

干货|全面介绍微软开源可解释机器学习框架InterpretML

微软开源机器学习框架Infer.NET

AI学习新选项:微软开源机器学习框架 Infer.NET

深度学习也有武林大会!八大科技巨头:我的“流派”才能实现AGI