ImageNet 数据集图像未正确加载
Posted
技术标签:
【中文标题】ImageNet 数据集图像未正确加载【英文标题】:ImageNet dataset images not loading properly 【发布时间】:2021-07-01 01:03:51 【问题描述】:我发现我们现在无法直接从 Pytorch 下载 ImageNet 数据集。我收到此错误:
RuntimeError: The dataset is no longer publicly accessible. You need to download the archives externally and place them in the root directory.
所以我去网站下载了32X32
图像(为什么下载这么慢?)。所以它分批下载了训练数据,当我加载其中一个并查看图像的样子时,我得到了这个:
这是我加载图像的方式:
file_1 = np.load("imagenet/Imagenet32_train_npz/train_data_batch_1.npz")
img = file_1['data'][0]
img = np.reshape(img, (32,32,3))
plt.imshow(img)
plt.show()
是我做错了什么还是 ImageNet 只是改变了?告诉我。
【问题讨论】:
【参考方案1】:我也遇到过同样的问题,我知道 imagenet 数据首先是通道,这意味着与其将其重新整形为 (32, 32, 3),不如将其重新整形为 (3, 32, 32) 然后转置它完整的代码如下所示:
file_1 = np.load("yourpath" , allow_pickle=True)
images = file_1["data"].reshape(-1 , 3 , 32 , 32)
images = images.transpose(0 , -2 , -1 , 1)
【讨论】:
以上是关于ImageNet 数据集图像未正确加载的主要内容,如果未能解决你的问题,请参考以下文章
Imagenet ILSVRC2014 验证基本事实到同义词集标签翻译不准确