如何在一个模型中训练多个损失,并在 pytorch 中选择冻结网络的某些部分?

Posted

技术标签:

【中文标题】如何在一个模型中训练多个损失,并在 pytorch 中选择冻结网络的某些部分?【英文标题】:How to train multiple losses in one model with freezing some part of the network optionally in pytorch? 【发布时间】:2020-10-09 11:49:20 【问题描述】:

我是 pytorch 的新手。 我正在实现一个具有两个分类器(黄色和紫色)​​的网络,如figure 所示。 问题是我想在网络训练黄色分类器时冻结红色部分,在网络训练紫色分类器时解冻红色部分。

我想实现的简短代码如下

# x is input and y_yellow, y_purple are labels of yellow and purple classifiers respectively.
criterion = CrossEntropyLoss()
opt = SGD()
model = my_model()

opt.zero_grad()
yellow_out, purple_out = model(x)

# freeze red part requires_grad = False

yellow_loss = criterion(yellow_out, y_yellow)
yellow_loss.backward()
opt.step()

opt.zero_grad()
# unfreeze red part requires_grad = True

purple_loss = criterion(purple_out, y_purple)
purple_loss.backward()
opt.step

请告诉我实现这个想法的确切方法。

代码顺序对吗?

我是否正确使用了 zero_grad?

我错过了什么吗?

我需要使用任何可选参数吗?

【问题讨论】:

【参考方案1】:

最简单的策略是不将红色模块的参数传递给优化器opt。或者,您可以将红色模块的参数设置为requires_gradFalse

它看起来像:

for param in red_module.parameters():
    param.requires_grad = False

让我知道这是否适合你。

【讨论】:

以上是关于如何在一个模型中训练多个损失,并在 pytorch 中选择冻结网络的某些部分?的主要内容,如果未能解决你的问题,请参考以下文章

Pytorch模型训练实用教程学习笔记:三损失函数汇总

用于训练的线性变换输出和地面实况的损失

Pytorch保留验证集上最好的模型

Pytorch模型保存与加载,并在加载的模型基础上继续训练

如何反转 PyTorch 嵌入?

pytorch Faster-RCNN 的验证损失