如何找到 Imagenet 数据标签?
Posted
技术标签:
【中文标题】如何找到 Imagenet 数据标签?【英文标题】:How can I find Imagenet data labels? 【发布时间】:2017-04-06 07:06:18 【问题描述】:我有两个关于如何加载 Imagenet 数据的问题。 我下载了 ILSVRC2012 验证集(因为训练集太大) 但我有两个问题。
我不明白如何才能找到标签。
只有 jpeg 文件的文件名类似于“ILSVRC2012_val_00000001.JPEG
”,但没有标签。我怎样才能找到它们?
据我所知,Imagenet 使用 224 * 224 像素的图像,问题只是“分类”而不是“检测”,但 ILSVRC2012 集有更多不同的像素大小。那么,如何才能获得 224 * 224 像素的正确框?
【问题讨论】:
我没有下载数据集,所以我无法回答第一部分,但可以肯定的是,有一些文件可能表明类号。关于您的第二个问题,到目前为止我阅读的大多数论文都表明他们选择输入为 224。如果您可以摆脱 FC 层,甚至通过调整输入大小或在输入上滑动,则具有不同的图像大小不是问题 另见:Where can I get labels for small ImageNet? 你或许可以回答How can I get the ImageNet ILSVRC 2012 data used for the classification challenge? 图像被调整为 224x224 以供网络使用。 @J.Park 你是怎么解决的? 【参考方案1】:确保从here 下载并解压每个文件 .tar 到一个文件夹中,每个类的编号为synsent
。最好的办法就是不要把图片混在一起。
【讨论】:
此链接已损坏。我想官方下载入口在这里:image-net.org/request【参考方案2】:它在开发工具包中(任务 1 和 2) 文件名为“ILSVRC2012_validation_ground_truth.txt”
【讨论】:
【参考方案3】:您将下载三个 tar 存档:一个用于训练数据,一个用于验证数据,一个用于测试数据。
训练数据包含在 1000 个文件夹中,每个类别一个文件夹(每个文件夹应包含 1300 张 JPEG 图像)。验证数据是一个包含 50k JPEG
图像的单个文件夹,在中查找对应的 ILSVRC2012_validation_ground_truth.txt
文件(正如 darren1231 提到的,它需要作为 DevKit 的一部分单独下载)。
测试数据类似于验证数据,但它没有标签(未向您提供标签,因为您需要将预测的标签提交给他们,作为比赛的一部分)。
-
ImageNet 图像具有可变分辨率,平均为 482x415,您可以自行决定如何处理它们以训练模型。大多数人处理它如下:首先缩小每个图像,使其短边为256像素。然后裁剪一个随机的 224x224 补丁。使用这些补丁进行训练(每个时期你会得到不同的作物)。在测试期间,做同样的事情,但提取一个中心 224x224 补丁,并使用它来评估分类准确性。有些人还使用多个补丁进行测试。同样,这取决于您,如果您愿意,可以使用更高的分辨率。
【讨论】:
以上是关于如何找到 Imagenet 数据标签?的主要内容,如果未能解决你的问题,请参考以下文章