深度学习—写作Dataset时是否应该使用shuffle

Posted 2021-07-20 songyuc

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了深度学习—写作Dataset时是否应该使用shuffle相关的知识，希望对你有一定的参考价值。

1 问题描述

在进行Dataset的写作时是否需要设置shuffle = True呢？伍老师说这样设置是不利于模型训练的，因为这样batch的数据会有周期性的特点；我个人是不赞同的；

为了在较小batch时同时保持训练的稳定性，我们使用了drop_last参数，此时我们必须使用shuffle = True，否则在遍历数据时，由于数据列表的顺序时确定的，则每次drop_last的数据也是确定的，则不足以形成batch的last数据永远无法遍历到；

以上是关于深度学习—写作Dataset时是否应该使用shuffle的主要内容，如果未能解决你的问题，请参考以下文章