刷榜大挑战!旷视RPC大型商品数据集发布(17大类200小类)

Posted 极市平台

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了刷榜大挑战!旷视RPC大型商品数据集发布(17大类200小类)相关的知识,希望对你有一定的参考价值。

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。点击文末“阅读原文”立刻申请入群~


近期,旷视南京研究院发布了一个新零售自动结算场景下的大型商品数据集RPC(论文RPC: A Large-Scale Retail Product Checkout Dataset,详细信息见文末),旨在为相关领域的基础研究提供一个演武场。


视觉自动结算任务示意


RPC数据集的特点

  • 量大】:无论商品类别(达200)还是图像总量(达83k)均是目前该领域之最。


刷榜大挑战!旷视RPC大型商品数据集发布(17大类200小类)

RPC与相关数据集在类别数和图像总量的对比


  • 跨域】:RPC中图像数据分为「单品图 exemplar image」和「结算图 checkout image」两种形态。模型需在单品图上进行训练,但真正测试环境则为结算图。




刷榜大挑战!旷视RPC大型商品数据集发布(17大类200小类)

单品图(exemplar image)

刷榜大挑战!旷视RPC大型商品数据集发布(17大类200小类)

三种难度的结算图(checkout image)


  • 真实】:在构造和采集结算图时,我们尽可能追求模拟真实购买场景,无论商品类别、商品个数、摆放角度及遮挡等等因素均接近实际零售场景。

  • 层级】:RPC中的200类商品隶属于17个商品大类(如方便面、纸巾、饮料等),天然构成了层次的结构。

  • 难易】:对于RPC中的结算图我们设计了三种难度:easy,medium和hard,包含的商品类别数和数量分别为:


刷榜大挑战!旷视RPC大型商品数据集发布(17大类200小类)

结算图的三种难度


  • 强弱】在监督信息层面,我们为每张RPC的结算图均提供了由弱(shopping list)到中(point)再到强(product bbox)的三种强度监督信息。


结算图的三种强度监督信息

Beyond RPC

除文章中定义的自动结算任务外,该数据集还可用于以下领域(但不限于)的科学研究:

  • Few-shot detection / recognition

  • Fine-grained detection / recognition

  • Domain transfer learning

  • Multi-category counting

  • Online learning

  • Weakly-supervised learning

  • And many more ...


目前baseline还很低,欢迎大家去刷榜~


相关链接

论文链接: https://arxiv.org/abs/1901.07249

项目链接:https://rpc-dataset.github.io/

魏大神专栏

https://zhuanlan.zhihu.com/p/55627416


*延伸阅读




每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流点击左下角“阅读原文”立刻申请入群~

以上是关于刷榜大挑战!旷视RPC大型商品数据集发布(17大类200小类)的主要内容,如果未能解决你的问题,请参考以下文章

2020年华云数字贸易平台财富榜大数据

把大核卷积拆成三步,清华胡事民团队新视觉Backbone刷榜了,集CNN与ViT优点于一身...

如何改进热图的大型数据集的 KQL 查询

大型数据集的排序无法完成

ios coredata 搜索大型数据集

无法为大型数据集运行 Spark 作业