《南溪的目标检测学习笔记》——训练PyTorch模型遇到显存不足的情况怎么办

Posted songyuc

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《南溪的目标检测学习笔记》——训练PyTorch模型遇到显存不足的情况怎么办相关的知识,希望对你有一定的参考价值。

1 前言

在目标检测中,可能会遇到显存不足的情况,我们在这里记录一下解决方案;

2 如何判断真正是出现显存(不是“软件误报”)

当前需要分配的显存在200MiB以下
例如:

RuntimeError: CUDA out of memory. Tried to allocate 60.00 MiB (小于200MiB) (GPU 0; 10.76 GiB total capacity; 8.71 GiB already allocated; 59.00 MiB free; 8.81 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

否则就是“软件误报”引起的OOM错误,则重新运行程序,错误可能就会消失;

3 如何减少PyTorch模型需要的显存

3.1 减小batch_size的数量

最小的数量可以设置为2;

以上是关于《南溪的目标检测学习笔记》——训练PyTorch模型遇到显存不足的情况怎么办的主要内容,如果未能解决你的问题,请参考以下文章

《南溪的目标检测学习笔记》——权重初始化

《南溪的目标检测学习笔记》——COCO数据集的学习笔记

《南溪的目标检测学习笔记》——数据集制作

《南溪的目标检测学习笔记》——模型预处理的学习笔记

《南溪的目标检测学习笔记》——基础算子的学习笔记

《南溪的目标检测学习笔记》——性能优化的学习笔记