深度学习—写作Dataset时是否应该使用shuffle

Posted songyuc

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习—写作Dataset时是否应该使用shuffle相关的知识,希望对你有一定的参考价值。

1 问题描述

在进行Dataset的写作时是否需要设置shuffle = True呢?伍老师说这样设置是不利于模型训练的,因为这样batch的数据会有周期性的特点;我个人是不赞同的;

2 Dataset需要使用shuffle——“配合drop_last实现数据遍历”

为了在较小batch时同时保持训练的稳定性,我们使用了drop_last参数,此时我们必须使用shuffle = True,否则在遍历数据时,由于数据列表的顺序时确定的,则每次drop_last的数据也是确定的,则不足以形成batch的last数据永远无法遍历到;

以上是关于深度学习—写作Dataset时是否应该使用shuffle的主要内容,如果未能解决你的问题,请参考以下文章

深度学习PyTorch Dataset类的使用与实例分析

深度学习入门:报错ModuleNotFoundError: No module named ‘dataset.mnist‘

「深度学习一遍过」必修3:Pytorch数据读取——使用Dataloader读取Dataset

深度学习笔记:tf.keras.preprocessing.image_dataset_from_directory运行错误

零基础入门深度学习3-1:数据管道Dataset

PyTorch学习6《PyTorch深度学习实践》——加载数据集(Dataset and DataLoader)