屌炸天:四个学生竟用百度PaddlePaddle整粗个“AI桃子选美机” 帮刘伯母一年省了3万块

Posted 小白不菜

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了屌炸天:四个学生竟用百度PaddlePaddle整粗个“AI桃子选美机” 帮刘伯母一年省了3万块相关的知识,希望对你有一定的参考价值。

【听杨姐说】

 

今年夏天,果农刘伯伯真是太开心了,就像天上掉馅饼一样,他预计今年全年能白白多赚3万块!


 

没错,这三万块是四个大学生帮他“捡到”的:北京工业大学自动化专业的学生周忠祥,和他的三个同学做了一台“桃子选美机”,就是根据大桃的大小、颜色、品相来自动给桃子做分类,目前机器分桃准确率已超过90%

 

对,就是这个玩意儿!


屌炸天:四个学生竟用百度PaddlePaddle整粗个“AI桃子选美机” 帮刘伯母一年省了3万块

别看这台机器不起眼,但有了这台机器刘伯伯少请了不少帮他分拣桃子的银,前后一算全年的话竟然一共省了3万多银子!

 

您可千万别以为挑桃子是件很容易的事。

 

要知道,桃子等水果的收获需要大量的人力,因为要想能够做到看一眼就熟练地将桃子根据色泽、形状、大小、重量等多个属性分为5档,可不是随便一个人就能做到的,这你杨姐我……就绝对不行!这没个四五年的功力还真的办不到,绝对得是务农的老司机才行!

 

3万块啊,对于城市里的白领可能还算不了什么,但是对于农民来说,这可真是就像牙缝里省出来的一样,真不容易啊!

 

这个机器由传送带、推拉装置、电路控制系统和大桃品相识别系统四部分构成——你以为容易么?就这台机器,其实是认了6400张图片后,才能光荣“上岗”的!

 

其实,最最核心的地方,就在于那个“品相识别系统”——姐开始还纳闷,就四个大学生,没数据没模型,怎么可能搞出了人工智能?一问才知道,原来学生们是用了百度PaddlePaddle深度学习平台的能力,再结合上自己的自动化专业能力才开发出来的。

 

诞生记

 

其实,这四位大学生其实对AI和深度学习并不是太了解,但他们知道,想要完成自动分类,需要一个易学易用的开源平台。

 

几番比较之后,他们选择了PaddlePaddle深度学习开源平台。周忠祥和他的同学在PaddlePaddle上下载了文档和代码,一周之内就建立了一个适用于桃子各个档次分类的图片分类模型,并确定了机器的完整方案。


屌炸天:四个学生竟用百度PaddlePaddle整粗个“AI桃子选美机” 帮刘伯母一年省了3万块

这几个大学生还挺费脑子,商量了不少方案!

 

录入数据其实挺麻烦的,6400张桃子照片啊!

屌炸天:四个学生竟用百度PaddlePaddle整粗个“AI桃子选美机” 帮刘伯母一年省了3万块

 

还在实验室里先拿各种海洋球试练!

屌炸天:四个学生竟用百度PaddlePaddle整粗个“AI桃子选美机” 帮刘伯母一年省了3万块

最终,才研制出了这台“桃子颜值选美机”,它可以按桃子的颜值,把桃子分别推到不同的筐里。工作起来是这样的:


屌炸天:四个学生竟用百度PaddlePaddle整粗个“AI桃子选美机” 帮刘伯母一年省了3万块

从原理和流程上看,AI武装之后的机器可以实现自动分拣大桃的全部过程:首先将桃子倒入机器,利用机械原理将桃子排成一排,接着自动对每一个桃子进行拍照,照片快速经过档次分类,之后由助推器来完成桃子的自动分类——这一切都在很短的时间内就得完成!


屌炸天:四个学生竟用百度PaddlePaddle整粗个“AI桃子选美机” 帮刘伯母一年省了3万块

 

注意,在这个过程中,最关键的就是“识别”这个环节!

 

在这个过程中,深度学习发挥了强大的作用,但要发挥这个效力,需要给机器训练大量的数据。

 

刚才咱们说过,学生们给机器分类“学习”了约6400张大桃照片。因为模型能从各个分类的照片中自动提取影响分类的要素,并形成自己的分类逻辑,学习后的机器就能像经验丰富的桃农一样,快速辨别桃子的品质。不仅如此,机器在使用中还会不断积累并学习新的数据,提升自身的准确率。

 


据悉,刘师傅和刘大妈家的40亩桃树如果都用上了智能分拣机,一年能省3万多块钱的雇工费。

 

好,接下来给爱学习的同学们讲讲百度开放的那个PaddlePaddle,理科的同学可以继续往下看哈,有点技术难度,看热闹的童鞋可以不用看了,买桃子去吧。

 

PaddlePaddle


PaddlePaddle,其实就是Parallel Distributed Deep Learning,学名“并行分布深度学习”,最早是由百度科学家和工程师共同研发的并行分布式深度学习平台,由于这个平台具备易用性、高效性、灵活性和可扩展性,目前已在百度内部数十个产品线上广泛使用。在201691日百度世界大会上,百度宣布正式开源,起名PaddlePaddle

 

凭姐这点简单地文科生理解能力,我认为这个PaddlePaddle其实就是把一系列的能力打了一个“包”,这个包呢,给他包上桃子的皮肤,它就能认桃子,给他包上李子的皮肤,它就能认李子,可以举一反三的那种。

 

而这个集合了很多种“能力”的包,也支持很多种深度学习模型,例如CNN(卷积神经网络)RNN(循环神经网络)DNN(深度神经网络),复杂记忆(Memory)模型NTM等,支持多种优化算法。其模型训练为支持大规模并行、多机多显卡计算,能够充分利用集群计算资源,并且支持线下多语言(Python/C++)预测接口。

 

这样的一个平台,百度拿出来免费,自然是希望有越来越多开发者用才好,因此其易用性十分突出,要不四个大学生怎么能轻易驾驭?

 

所以,易用性是PaddlePaddle的设计初衷之一,它支持使用PythonC++来构建系统,更加直观且灵活,易于部署。同时可一键式安装,丰富的模型示例,并配有完善的中、英双语文档。

 

而在灵活性上, PaddlePaddle支持多种神经网络结构和优化算法,支持可高度定制的 RNN 单元:用户可以按照自己所需的逻辑定义 RNN 单元一个时间步之内完成的运算,由 PaddlePaddle 负责该运算在序列输入上的循环展开,以此实现非常复杂的自然语言处理任务;灵活的序列输入,PaddlePaddle 原生地支持序列和嵌套序列输入,这是许多深度学习平台不具备的!

 

此外,它还很高效——不需要 Padding RNN PaddlePaddle 中的各种 RNN 单元都经过专门地优化(坦白说);其扩展性上,PaddlePaddle全面支持多机、多GPU环境,优化的通信实现使高吞吐与高性能成为可能。

 

正是由于有了这些“傻瓜”功能,PaddlePaddle已经被部署到百度的多个产品或服务中,包括预估外卖出餐时间、预判网盘损坏时间、精准推荐用户所需信息、大体量图像分类、字符识别(OCR),计算机病毒垃圾信息检测、机器翻译、甚至在自动驾驶等领域。

 

这四个大学生竟然把“桃子选美机的整套方案和源代码开源到Github平台上去了。你也可以瞬间复制一个,还能看心情来个代码迭代,优化一下机器,也许还能拿来当个创业项目做做。

 

还是举几个栗子吧:

 

用百度这套傻瓜AI,少加修改,就能搞成很多玩法:

 

首先,通过叠加多个长短时间记忆的单元,就能构成深度循环神经网络。让它对从点评网站收集到的用户评论进行学习的话,这个AI系统模型可以自动判断用户评论的感情色彩,建立商家好感度模型,帮助商家了解用户喜好变化,从而改善营销策略。

 

又如咱们写稿的高级民工吧,它甚至可以自动搞出“动态标题”——现在各家新闻客户端不是都在玩“千人千面”吗?

 

你可以这样理解,这套模型含有三个RNN单元,一个编码原始标题,一个编码个性化参考信息,最后一个RNN单元将所有编码信息逐步释放,解码为改写后的标题。模型为同一篇文章生成不同的标题,以吸引不同用户。

 

再举一个栗子,就是应用于优质答案推荐。

如果是左右两个完全对称的神经网络分别对两组问答对进行打分,通过学习,深度神经网络会给予相关性高的问答更高分值。而问答相关性模型则可以帮助问答平台删除作弊问答,同时自动推荐优质问答。

 

在这四个大学生中,有一个是在中国待了3年的肯尼亚学生Simon,他一直觉得中国的人工智能技术很酷。看这桃子选美机不错,Simon打算日后将百度的人工智能技术用到家乡肯尼亚的农业上,实现芒果、百香果等水果的智能分拣。



童鞋们,看到他得意的小眼神了么?


以上是关于屌炸天:四个学生竟用百度PaddlePaddle整粗个“AI桃子选美机” 帮刘伯母一年省了3万块的主要内容,如果未能解决你的问题,请参考以下文章

阿里巴巴29个屌炸天的开源项目,你用过几个?

阿里巴巴26个屌炸天的开源项目,你知道几个?

屌炸天的3D引擎OpenCASCADE的用法及案例(转载之处:)

屌炸天,Oracle 发布了一个全栈虚拟机 GraalVM,支持 Python!

这些屌炸天的创业者为何对投资人说NO

82岁老太自学编程开发游戏,这就是传说中的屌炸天?