图像识别领域的小可爱在吗?这里有BIG BONUS哦!

Posted 天池大数据科研平台

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了图像识别领域的小可爱在吗?这里有BIG BONUS哦!相关的知识,希望对你有一定的参考价值。

hi各位宝宝
你们想我了吗


小可爱天天出现辣!

图像识别领域的小可爱在吗?这里有BIG BONUS哦!


这次我们来详细介绍一下天池的新赛事!

如果你对图像识别有兴趣
那么请稳住,看这篇!

图像识别领域的小可爱在吗?这里有BIG BONUS哦!


阿里巴巴“图像和美”团队联合华南理工大学共同举办的ICPR MTWI(Multi-Type Web Image)2018 挑战赛正式开启,并开放业内第一个基于网络图片的中英混合数据集——MTWI数据集。

天池数据众智平台(tianchi.com),是中国第一大数据开发者社区,集品牌、生态、人才、解决方案为一体,为本次挑战赛提供平台支撑及运营保障。天池已成功运作60余场高规格数据类竞赛,拥有近17万来自全球89个国家和地区的数据开发者,凭借严谨科学的赛制,为本次大赛公平公正的开展运作保驾护航。

大赛介绍

ICPR (International Conference on Pattern Recognition)2018 是图像识别与机器视觉领域的国际学术顶会。

互联网世界中,图片是传递信息的重要媒介。特别是电子商务、社交、搜索等领域,每天都有数以亿兆级别的图像在流动传播。基于深度学习的图片文字识别(OCR)技术正飞速发展,并深刻影响着信息的交互和传递方式,乃至改变相关行业的生产方式。而在学术领域,图片中的文字识别(OCR)同样也是研究重点,但目前业内依旧缺少基于网络图片的、以中文为主的OCR数据集。


图像识别领域的小可爱在吗?这里有BIG BONUS哦!


大赛聚焦OCR领域相关实用知识点的突破与解决,旨在与全球AI科研人才一起共同推动OCR在工业界的应用和发展。

 

数据说明

本次大赛发布的MTWI数据集来源于真实网络场景,以“来源于实践,且高于实践”为构建理念,既考虑到学术价值同时也兼顾工业适用性。


不同于纯文档图片和场景文字图片,MTWI数据集中的图片多为作者设计或者二次加工所得。整体上看,这类图片不仅包含部分场景图片和文档图片,更多的是在这些图片基础上添加设计好的文字而成的新图片。


图像识别领域的小可爱在吗?这里有BIG BONUS哦!

左一:空心字,切断字,中英混排 /左二:封面印刷文字,离散单字,重叠字/左三:实拍,自然场景,艺术文字/左四:大字中镶嵌小字,不同字号混排


从数据场景上看,本数据集涵盖了数码合成、物体表面、封面类印刷的中英文以及少量日文、韩文等类型的文字。而从文字版式上来看,包含了各种字体类型的单字、横排、竖排、倾斜排列、曲线排列、复杂混排(不同字号、不同字体、不同字间距的混合排布)等。

 

因此,本次大赛发布的数据集既有图片文字识别的共性也有本身的特性,突出覆盖前沿技术尚未解决或者遗漏的样例,并基于OCR领域乃至计算机视觉领域的前沿指标,设置文本检测,文本行识别,端到端的整图文字识别三个层次的赛题,对相关技术点的解决以及在工业领域的信息数字化应用将具有直接的推动作用。

大赛日程


图像识别领域的小可爱在吗?这里有BIG BONUS哦!


参赛对象

- 大赛面向全社会开放,阿里巴巴集团赛题组相关人员禁止参赛。

- 大赛以个人或 1-8 人组队形式报名参赛。

- 任何作弊行为会被取消参赛资格,包括:虚假信息报名,提交手工标注结果,比赛报告中有虚假内容,同一选手注册多账号提交结果。


奖项设置

- 冠军:1支队伍,奖金¥15000RMB

- 亚军:1支队伍,奖金¥10000RMB

- 季军:1支队伍,奖金¥5000RMB

* 比赛前三名的队伍会被邀请至ICPR 2018北京大会上进行颁奖。

点击阅读原文,立即参赛!

以上是关于图像识别领域的小可爱在吗?这里有BIG BONUS哦!的主要内容,如果未能解决你的问题,请参考以下文章

行业 | 图像识别领域四大天王哪家强?

线性判别分析(LDA)原理

线性判别分析LDA总结

图像识别在快消品领域的应用-陈列AI自检

图像识别算法及案例

在图像视频识别领域大数据分析比人脑更准确