ONNX 和 TensorRT 模型中的参数数量和 FLOPS

Posted

技术标签:

【中文标题】ONNX 和 TensorRT 模型中的参数数量和 FLOPS【英文标题】:Number of parameters and FLOPS in ONNX and TensorRT model 【发布时间】:2021-11-24 14:23:41 【问题描述】:

将模型从 PyTorch 转换为 ONNX 或 TensorRT 格式时,参数数量和 FLOPS(每秒浮点操作数)是否会发生变化?

【问题讨论】:

【参考方案1】:

我知道,由于 Pytorch 的一些新版本(我使用的是 1.8 并且它对我有用),因此在保存模型的同时有一些批量规范层和卷积的融合。我不确定 ONNX,但 TensorRT 积极使用不同层的水平和垂直融合,因此最终模型的计算成本会比您初始化的模型低。

【讨论】:

以上是关于ONNX 和 TensorRT 模型中的参数数量和 FLOPS的主要内容,如果未能解决你的问题,请参考以下文章

FastReid模型转为ONNX和TensorRT模型

pytorch C++部署模型 ONNX tensorRT

TensorRT 调用onnx后的批量处理(上)

pytorch upsample层到onnx,以及到tensorRT的转换

还在为模型加速推理发愁吗?不如看看这篇吧。手把手教你把pytorch模型转化为TensorRT,加速推理

TensorRT安装记录(8.2.5)