torch Dataset类

Posted ʚVVcatɞ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了torch Dataset类相关的知识,希望对你有一定的参考价值。

实现Dataset类:

  • __init__:初始化信息

  • __getitem__:传入的图片路径和下标返回目录下的图片信息

  • __len__:返回图片的张数

from torch.utils.data import Dataset
import os
import cv2 as cv

class MyData(Dataset):  # 继承Dataset

    def __init__(self, root_dir, label_dir):
        self.root_dir = root_dir   # 定义根目录
        self.label_dir = label_dir  # 定义标签目录
        self.path = os.path.join(self.root_dir, self.label_dir)  # 定义路径
        self.img_path = os.listdir(self.path)   # 定义图片路径

    def __getitem__(self, index):
        img_name = self.img_path[index]  # 获取每一张图片的名称
        img_item_path = os.path.join(self.root_dir, self.label_dir, img_name)  # 将存放图片的路径进行拼接
        img = cv.imread(img_item_path)   # 读取路径中的图片
        label = self.label_dir   # 图片的标签
        return img, label

    def __len__(self):
        return len(self.img_path)  # 获取有多少张图片


root_dir = "dataset/val"  # 根目录
ants_label_dir = "ants"   # 存放蚂蚁的目录
bees_label_dir = "bees"   # 存放蜜蜂的目录
ants_dataset = MyData(root_dir, ants_label_dir)  # 实例化 ants 
bees_label_dir = MyData(root_dir, bees_label_dir)  # 实例化 bees 

print("ants_dataset:", len(ants_dataset))
print("bees_label_dir:", len(bees_label_dir))

train_dataset = ants_dataset + bees_label_dir  # 将两个数据集存放到一起
print("train_dataset:", len(train_dataset))

img1, label1 = train_dataset[69]  # 查看第70张图片和标签信息

img2, label2 = train_dataset[70]  # 查看第71张图片和标签信息

#  图像显示
cv.imshow("image1", img1)
cv.imshow("image2", img2)
cv.waitKey(0)
cv.destroyAllWindows()

在这里插入图片描述

以上是关于torch Dataset类的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 torch Dataloader 获取具有相同类的图片?

PyTorch之torch.utils.data.DataLoader解读

torch.utils.data数据处理

Torch / Lua,如何选择数组或张量的子集?

torch_12_dataset和dataLoader

pytorch torch类