pytorch1.0 用torch script导出保存模型

Posted 2021-01-16 arborday

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了pytorch1.0 用torch script导出保存模型相关的知识，希望对你有一定的参考价值。

python的易上手和pytorch的动态图特性，使得pytorch在学术研究中越来越受欢迎，但在生产环境，碍于python的GIL等特性，可能达不到高并发、低延迟的要求，存在需要用c++接口的情况。除了将模型导出为ONNX外，pytorch1.0给出了新的解决方案：pytorch 训练模型 - 通过torch script中间脚本保存模型 -- C++加载模型。最近工作需要尝试做了转换，总结一下步骤和遇到的坑。

用torch script把torch模型转成c++接口可读的模型有两种方式：trace && script. trace比script简单，但只适合结构固定的网络模型，即forward中没有控制流的情况，因为trace只会保存运行时实际走的路径。如果forward函数中有控制流，需要用script方式实现。

trace顾名思义，就是沿着数据运算的路径走一遍，官方例子：

import torch
def foo(x, y):
    return 2*x + y
traced_foo = torch.jit.trace(foo, (torch.rand(3), torch.rand(3)))

script稍复杂，主要改三处：

1. Model由之前继承 nn.Model 改为继承 torch.jit.ScriptModule

2. forward函数前加 @torch.jit.script_method

3. 其他需要调用的函数前加 @torch.jit.script

踩过的坑&&解决方法：

A. torch script默认函数或方法的参数都是Tensor类型的，如果不是需要说明，不然调用非Tensor参数时会报类型不符的编译错误。

python3可以直接:

def example_func(param_1: Tensor, param_2: int, param_3: List[int]):

python2需要用type注释：

def example_func(param_1, param_2, param_3):

#type: (Tensor, int, List[int]) -> Tensor

B. model的方法中orward加@torch.jit.script_method， __init__函数不用

C. 前面说过，torch scrip支持的函数是pytorch的子集，意味着有一部分函数不支持，例如： not boolean，pass, List的切片赋值，CPU和GPU切换的value.to( ), 需要想办法绕过去。看github上讨论区说新版好像已经支持not操作了，没有验证。

结论：pytorch 1.0目前的预览版还有比较多优化的空间，至少是在torch script支持的函数集合上，不建议使用，等稳定版发布再看看吧。

原创内容，转载请注明出处。

参考资料：

https://pytorch.org/docs/master/jit.html

https://pytorch.org/tutorials/beginner/deploy_seq2seq_hybrid_frontend_tutorial.html

以上是关于pytorch1.0 用torch script导出保存模型的主要内容，如果未能解决你的问题，请参考以下文章

10张思维导图带你学习Java?Script

pytorch常用代码

Anaconda 配置各版本 Pytorch 深度学习环境

Centos7.5服务器安装（并添加用户） anaconda3 并配置 PyTorch1.0

pytorch1.0 搭建LSTM网络

pytorch1.0 安装执行后报错ImportError: No module named future.utils