关于tensorflow的显存占用问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关于tensorflow的显存占用问题相关的知识,希望对你有一定的参考价值。

参考技术A 随便记录下观察结果(也不一定对)
如果tensorflow和pytorch 同时初始化在一个GPU中,会导致tensorflow变慢
但是让tensorflow先初始化,问题可能会得到改善

都知道tensorflow如果不限制,会把显存吃满,导致其他框架的模型无法初始化。有个比较奇特的一点,对每一个模型限制内存后 ,两个相同参数量tensorflow模型都初始化完毕后显存占用却和一个差不多,看起来是相同计算框架下面可以共存部分。但是如果不限制,会直接初始化失败,就不能共存。

如果有相关研究比较深入的,望讲解一下,谢谢

Ubuntu-Tensorflow 程序结束掉GPU显存没有释放的问题

笔者在ubuntu上跑Tensorflow的程序的时候,中途使用了Win+C键结束了程序的进行,但是GPU的显存却显示没有释放,一直处于被占用状态。 
使用命令 
nvidia-smi 
显示如下

两个GPU程序都在执行中,实际上GPU:0已经被笔者停止了,但是GPU没有释放,进程还在继续,所以只有采用暴力手段了,将进程手动关闭掉,进程编号如图中红线部分,由于笔者在两个GPU跑的程序一样,很难从程序名称上找到自己,却可以从GPU:num上找到自己的PID。 
关闭命令如下: 
sudo kill -9 PID

好,完美解决GPU显存释放问题.

 

以上是关于关于tensorflow的显存占用问题的主要内容,如果未能解决你的问题,请参考以下文章

tensorflow报错 或者 keras报错 以及tf.keras报错: OOM 显存不足

tensorflow GPU 显存分配设置

Ubuntu-Tensorflow 程序结束掉GPU显存没有释放的问题

TensorFlow中使用GPU

关于类型为numpy,TensorFlow.tensor,torch.tensor的shape变化以及相互转化

TensorFlow设置GPU占用量