Top10唯一中国团队!数相名列Kaggle图像识别国际大赛第七

Posted 南方都市报

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Top10唯一中国团队!数相名列Kaggle图像识别国际大赛第七相关的知识,希望对你有一定的参考价值。

UTC时间2017年3月2日24点,Kaggle国际猫狗识别比赛落下帷幕,据公开数据,数相科技Matview团队在来自全球的1314支参赛团队中,名列第七(前1%),是唯一一支进入到前十的中国参赛团队。 

 

Kaggle国际猫狗识别比赛 top 10


1
跟谁比?

本次比赛,赛程总计历时6个月,吸引了包括美国、瑞士、德国、法国、新加坡、印度等地的数据科学家、研究人员、博士,甚至硅谷等地的人工智能企业团队参加。


当然,也有不少中国的个人和团队参赛,其中只有Matview进入了前10名。同进前十的参赛者中,不乏谷歌工程师、知名黑客、机器学习首席数据科学家等专业人士。IIT Bombay的数据科学家Damodar也有参赛,他是深度学习图像分类方向的大牛,本次比赛也获得了第22名的成绩。


top 10 详见下图,未及的名次为未留资料者。

NO.2  guangsha

密歇根大学博士,谷歌工程师

NO.4  Bojan Tunguz

美国Tunguz Consulting公司CEO及首席数据科学家

NO.6  lefant

瑞典著名黑客

NO.7  Matview

数相科技,here! 

NO.8  

Bancroft Way Systems

Services NEC industry旗下企业

NO.9  Arvinder Chopra 

Effective Health Systems公司团队


2
Kaggle是啥? 

成立于2010年的Kaggle是一个进行数据发掘和预测竞赛的在线平台。万事达、辉瑞制药公司、好事达保险公司和Facebook,甚至NASA都曾在这个平台上发起过竞赛。


目前,Kaggle上已有超过8.5万的数据科学家。美国运通和纽约时报等公司已经把Kaggle排名作为数据科学家招聘过程中的重要标准。排名不仅仅是程序员的勋章,而是一种比传统标准更为重要、更具价值的能力证明


正如Kaggle在本次国际猫狗识别比赛的介绍中所说,2013年以来,机器学习领域发生了很多变化。特别是深度学习和图像识别,这项本是数学家们无聊时用来打发时间的下午茶技术,现在正广泛地被运用于实际的生活和生产。


3
为什么Matview会参赛? 

三个月前,数相科技Matview团队第一次知道了Kaggle本次的猫狗识别比赛。当时六个月赛程已经过半,“但我们仍然决定挑战一下自己。”数相科技Matview团队CEO邓立邦说。


彼时Matview的物种识别机器人正逐渐成型,美国养犬俱乐部(AKC,American Kennel Club)的256种纯种狗,及国际爱猫联合会(CFA,The Cat Fanciers’ Association, INC.)的42种纯种猫,机器人都已经学会了。通过比赛让机器学会区分狗和猫,正好是另一个维度的学习机会。


比赛中所使用的素材,左猫,右狗,你猜对了么?


与一般机器训练所使用素材不同的是,比赛使用的图片集,大多取自真实的生活拍摄,有相当一部分素材存在像素不高、画面暗沉、目标不清晰、背景杂乱等问题。然而,这并不是团队遇到的最大挑战。


在接近项目结束时,Matview团队因服务器配置不高,遭受了机器死机的“飞来横祸”。据工程师说,跑了2个星期的训练模型当时存在临时目录,结果什么都没了,场面一度很绝望。这大概相当于辛辛苦苦写了2万字的课程论文,在要提交的时候停了电,你还没来得及保存。


后来大家咬着牙做了模型的再简化,正好在截止前赶上了出结果,再后来的事情大家就都知道了,成绩去到了第七,happy ending。


4
Matview是啥? 

数相科技Matview,由南方报业旗下凯迪数据研究中心升级而来,立志成为全球领先的人工智能模式识别公司,并以“传承与扩展人类经验及认知能力”为使命。


今年一月,数相科技与中国林产工业协会非洲分会、跨境电商百百购、国际野生物贸易研究组织、中科院华南植物园等正式签署了战略合作协议,共同推进图像识别在行业中的应用。


接下来团队也将加速推出面向个人用户、解决市民生活需求的 AI 应用。敬请期待^_^



点击阅读原文查看关于Matview的资讯

以上是关于Top10唯一中国团队!数相名列Kaggle图像识别国际大赛第七的主要内容,如果未能解决你的问题,请参考以下文章

Kaggle—So Easy!百行代码实现排名Top 5%的图像分类比赛

全网唯一秃头数据集:20万张人像,网罗各类秃头

记一次图像识别的冒险

实战 Kaggle 比赛:图像分类(CIFAR-10) 动手学深度学习v2

如何从多个 .csv 文件中的命名列中选择唯一值?

图像识别的发展与挑战