笔记本深度学习训练散热实用指南

Posted kv1830

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了笔记本深度学习训练散热实用指南相关的知识,希望对你有一定的参考价值。

笔记本的散热能力远不如台式机,跑深度学习训练的时候如果不注意散热有可能会导致温度过高,可能会烧显卡烧主版等等,本文就讨论一下如何用一种简单的办法提升笔记本的散热能力。

注意,事先声明:

(1)本贴仅供参考,具体情况具体分析,如果参考本帖后导致笔记本出现什么意外,概不负责!

(2)本贴适合的情况是:笔记本的进风口在底部,否则可以忽略本贴

实验笔记本:雷神zero,显卡3080

室温:17.6度

1.准备训练数据

就拿yolov5跑coco数据集为例。(我拿的版本是yolov5-6.2,版本不是重点,本文的重点是散热~~)

先简单说一下数据准备:

(1)下载coco数据集的图片就行了,下面这3个就是图片压缩包地址:

http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/zips/test2017.zip  ---test其实在训练的时候用不到,也可以不下
(2)并不需要下载coco数据集的标签,因为有现成的已经转成yolo格式的标签

https://github.com/ultralytics/yolov5/releases/download/v1.0/coco2017labels.zip

(3)解压coco2017labels.zip至任意目录,比如我解压到D:\\dataset\\COCO2017里面,coco是压缩包里的根目录,解压完了就有了如下的东西,红框里的就是训练真正要用的东西

 (4)接下来把步骤(1)中下载的coco图片压缩包解压到coco\\images中,解压完了如下,红框是必须的

 (5)yolov5里面的data/coco.yaml要修改一下,因为我的coco目录不一样,把path改为我实际的目录就行了

 接下来就可以打开命令行,cd到yolov5的目录里,然后执行如下命令就可以开始训练了,我这就用yolov5s的模型规模来训练

python train.py --data data/coco.yaml --cfg models/yolov5s.yaml --weights '' --batch-size 32 --epochs 300   --name coco  

注:batch-size视显存大小而定,我用32的话,显存大概占了9G左右。

另外,在windows上训练的时候,如果batch-size设的比较大,得把虚拟内存也调大,因为默认会用多进程加载数据,每个进程在加载pytorch的dll的时候都会占比较大的内存,所以会报一个分页错误啥的,我这虚拟内存设的就是100GB

接下来分几种情况来看散热效果(其实前面说了一堆跟散热没关系的东西,只是为了防止审核不通过,硬加点训练的说明进来~~),接下来进入正题。。。

2.实用方法

 先看一下我的笔记本的底部情况,底下是进风口,出风口在笔记本的后面,底部前后两边有两条黑色的很浅的垫条。所以如果直接把它放在桌上,它底部的进风空间其实是很小的。

如果是放在一个软垫上,可能导致底部的空间更小。那么主要问题就是:没有空间进风。

 解决办法很简单,把笔记本垫高一点,让它的底部空间变大不就行了麻,找两个垫条,放在笔记本的垫条的位置,注意不要挡住进风口,这样就增大了底部的进风空间。

如下图,我直接搞了两条泡沫条。按如上的方法把笔记本放上去。

 接下来开始训练,我笔记本上有个强风按钮,为了减小干扰方便对比,直接就开强风模式了,跑了5分多钟,温度差不多就在65度徘徊(也有可能后面还会涨,不过主要是为了对比其它情况)

显卡温度可以直接在任务管理器里面看,也可以用nvidia-smi来看,如下图,温度65度,显卡利用率84%(任务管理器里面那个不知道为啥是0~~)

 3.撤掉泡沫条

现在对比一下,不用泡沫条垫高,同样是开强风,5分多钟温度已经上70度了,后面可能还会更高,差距还是很明显的。

 4.试一下散热底座

某品牌的散热底座(花了我100块。。。),下面有6个风扇,风力一般般,把笔记本放上去用它试一下,笔记本继续开强风

 

 5分多钟后温度已经在66-67徘徊,跟我的泡沫条效果差不多,时间长的话可能还略逊一筹。这个散热底座其实并不是很适合我的笔记本,因为

(1)主要矛盾是底部进风空间不够,而不是风力不够,而且这散热底座的风力没多大。

(2)这底座本身很高,放在上面使用很不方便。

(3)如果我搞两个更高的垫条,效果可能会更好。其实我直接用手试过,用手把笔记本抬高,温度直接能掉到63度以下。

 5.终极形态

开个玩笑~~,不过真的很有效哦,滑倒了概不负责!

以上是关于笔记本深度学习训练散热实用指南的主要内容,如果未能解决你的问题,请参考以下文章

深度学习模型超参数搜索实用指南

吴恩达-深度学习-课程笔记-6: 深度学习的实用层面( Week 1 )

[人工智能-深度学习-38]:环境搭建 - 训练主机硬件选择全指南(CPU/GPU/内存/硬盘/电源)

a2000显卡可以深度学习吗?

深度学习超参数搜索实用指南

GPU进行深度学习训练——新手指南