深入学习Google Colab：加载大型图像数据集的时间很长，如何加速这个过程？

Question

我正在使用Keras开发深度学习模型，并加快计算速度，我想使用google colab上提供的GPU。

我的图片文件已加载到我的google云端硬盘上。我有24'000张图像用于训练4'000用于测试我的模型。

然而，当我将图像加载到数组中时，需要很长时间（差不多2小时）所以每次使用谷歌colab笔记本时这样做都不是很方便。

你知道如何加速这个过程吗？这是我目前的代码：

TRAIN_DIR  = "Training_set/X"
TRAIN_DIR_Y = "Training_set/Y"
IMG_SIZE = 128

def parse_img_data(path):
    X_train = []
    index_train = []
    img_ind = []
    for img in tqdm(os.listdir(path)):
        img_ind.append(int(img.split('.')[0])-1)
        path = os.path.join(TRAIN_DIR,img)
        img = cv2.imread(path,cv2.IMREAD_COLOR)
        img = cv2.resize(img, (IMG_SIZE,IMG_SIZE))
        X_train.append(np.array(img))
    return np.array(img_ind), np.array(X_train)

ind_train, X_train = parse_img_data(TRAIN_DIR)

如果你能帮助我，我将非常感激。

泽维尔

Answer 1

另一答案