如何找到 Imagenet 数据标签?

Posted

技术标签:

【中文标题】如何找到 Imagenet 数据标签?【英文标题】:How can I find Imagenet data labels? 【发布时间】:2017-04-06 07:06:18 【问题描述】:

我有两个关于如何加载 Imagenet 数据的问题。 我下载了 ILSVRC2012 验证集(因为训练集太大) 但我有两个问题。

    我不明白如何才能找到标签。 只有 jpeg 文件的文件名类似于“ILSVRC2012_val_00000001.JPEG”,但没有标签。我怎样才能找到它们?

    据我所知,Imagenet 使用 224 * 224 像素的图像,问题只是“分类”而不是“检测”,但 ILSVRC2012 集有更多不同的像素大小。那么,如何才能获得 224 * 224 像素的正确框?

【问题讨论】:

我没有下载数据集,所以我无法回答第一部分,但可以肯定的是,有一些文件可能表明类号。关于您的第二个问题,到目前为止我阅读的大多数论文都表明他们选择输入为 224。如果您可以摆脱 FC 层,甚至通过调整输入大小或在输入上滑动,则具有不同的图像大小不是问题 另见:Where can I get labels for small ImageNet? 你或许可以回答How can I get the ImageNet ILSVRC 2012 data used for the classification challenge? 图像被调整为 224x224 以供网络使用。 @J.Park 你是怎么解决的? 【参考方案1】:

确保从here 下载并解压每个文件 .tar 到一个文件夹中,每个类的编号为synsent。最好的办法就是不要把图片混在一起。

【讨论】:

此链接已损坏。我想官方下载入口在这里:image-net.org/request【参考方案2】:

它在开发工具包中(任务 1 和 2) 文件名为“ILSVRC2012_validation_ground_truth.txt”

【讨论】:

【参考方案3】:

    您将下载三个 tar 存档:一个用于训练数据,一个用于验证数据,一个用于测试数据。

    训练数据包含在 1000 个文件夹中,每个类别一个文件夹(每个文件夹应包含 1300 张 JPEG 图像)。验证数据是一个包含 50k JPEG 图像的单个文件夹,在中查找对应的 ILSVRC2012_validation_ground_truth.txt 文件(正如 darren1231 提到的,它需要作为 DevKit 的一部分单独下载)。

测试数据类似于验证数据,但它没有标签(未向您提供标签,因为您需要将预测的标签提交给他们,作为比赛的一部分)。

    ImageNet 图像具有可变分辨率,平均为 482x415,您可以自行决定如何处理它们以训练模型。大多数人处理它如下:首先缩小每个图像,使其短边为256像素。然后裁剪一个随机的 224x224 补丁。使用这些补丁进行训练(每个时期你会得到不同的作物)。在测试期间,做同样的事情,但提取一个中心 224x224 补丁,并使用它来评估分类准确性。有些人还使用多个补丁进行测试。同样,这取决于您,如果您愿意,可以使用更高的分辨率。

【讨论】:

以上是关于如何找到 Imagenet 数据标签?的主要内容,如果未能解决你的问题,请参考以下文章

Imagenet ILSVRC2014 验证基本事实到同义词集标签翻译不准确

)-ImageNet数据集的准备

Imagenet 是不是包含未标记的数据? [关闭]

)-在ImageNet数据集上训练AlexNet

Keras如何改变加载模型的可训练层

Image_classification 使用 resnet50 模型和带有我的自定义标签的 imagenet db