Flask 推理模型,显存一直增长。

Posted AI浩

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Flask 推理模型,显存一直增长。相关的知识,希望对你有一定的参考价值。

问题
使用Flask调用DNN模型推理API时,每调用一次API,显存持续增长,直至最终显存爆炸强制退出程序。
解决方法

flask2.0的app.run()中默认打开了threaded=True来支持多线程并发请求,从而导致显存泄漏。每次调用,显存就持续增长。
解决方法为:把多线程改为单线程,设置app.run()中threaded和debug为False。示例如下:


然后,就可以正常推理了。

下面的没有用啊!

下面的没有用啊!

下面的没有用啊!

下面的没有用啊!
写够500字,否则
文章质量提示
文章质量提示
此文章质量较低,不会获得较多流量扶持! 可能的原因为:篇幅太短,广告涉嫌违规,外链过多,缺少代码,图片涉嫌违规
文章质量提示
此文章质量较低,不会获得较多流量扶持! 可能的原因为:篇幅太短,广告涉嫌违规,外链过多,缺少代码,图片涉嫌违规
此文章质量较低,不会获得较多流量扶持! 可能的原因为:篇幅太短,广告涉嫌违规,外链过多,缺少代码,图片涉嫌违规

2022深度学习开发者峰会 5月20日13:00让我们相聚云端,共襄盛会!

以上是关于Flask 推理模型,显存一直增长。的主要内容,如果未能解决你的问题,请参考以下文章

XEngine:深度学习模型推理优化

穷!深度学习中如何更好地利用显存资源?

CoreML 推理时间是不是会随着迭代而增长?

ChatGPT低成本复现流程开源!任意单张消费级显卡可体验,显存需求低至1.62GB

推理加速 GPT-3 超越英伟达方案50%,开源方案打通大模型落地关键路径

速度超快!字节跳动开源序列推理引擎LightSeq