keras 如何处理多重损失?
Posted
技术标签:
【中文标题】keras 如何处理多重损失?【英文标题】:How does keras handle multiple losses? 【发布时间】:2018-08-30 10:53:04 【问题描述】:如果我有类似的东西:
model = Model(inputs = input, outputs = [y1,y2])
l1 = 0.5
l2 = 0.3
model.compile(loss = [loss1,loss2], loss_weights = [l1,l2], ...)
Keras 如何处理损失以获得最终损失? 是不是类似:
final_loss = l1*loss1 + l2*loss2
另外,在训练期间是什么意思? loss2 是否仅用于更新 y2 来自的层的权重?还是用于模型的所有层?
【问题讨论】:
【参考方案1】:来自model
documentation:
loss:字符串(目标函数的名称)或目标函数。见损失。如果模型有多个输出,您可以通过传递字典或损失列表在每个输出上使用不同的损失。模型将最小化的损失值将是所有单个损失的总和。
...
loss_weights:可选列表或字典,指定标量系数(Python 浮点数)以加权不同模型输出的损失贡献。然后,模型将最小化的损失值将是所有单个损失的加权总和,由
loss_weights
系数加权。如果是列表,则预计与模型的输出有 1:1 的映射关系。如果是张量,则应将输出名称(字符串)映射到标量系数。
所以,是的,最终损失将是“所有个人损失的加权总和,由loss_weights
系数加权”。
您可以查看code where the loss is calculated。
另外,在训练期间是什么意思? loss2 是否仅用于更新 y2 来自的层的权重?还是用于模型的所有层?
权重通过backpropagation 更新,因此每个损失只会影响将输入连接到损失的层。
例如:
+----+
> C |-->loss1
/+----+
/
/
+----+ +----+/
-->| A |--->| B |\
+----+ +----+ \
\
\+----+
> D |-->loss2
+----+
loss1
将影响 A、B 和 C。
loss2
将影响 A、B 和 D。
【讨论】:
注意!!!来自文档:'如果模型有多个输出......模型将最小化的损失值将是所有个体损失的总和'(合理)tensorflow.org/api_docs/python/tf/keras/Model#compile所以最终损失将影响所有跨度> 【参考方案2】:对于反向传播的多个输出,我认为这不是 Fábio Perez 提到的完整答案。
另外,在训练期间是什么意思? loss2是否只用于 更新 y2 来自的层的权重?或者它是否用于 模型的所有层?
对于输出 C 和输出 D,keras 将计算最终损失 F_loss=w1 * loss1 + w2 * loss2。然后,将最终的损失 F_loss 应用于输出 C 和输出 D。最后来自输出 C 和输出 D 的反向传播,使用相同的 F_loss 进行反向传播。
【讨论】:
以上是关于keras 如何处理多重损失?的主要内容,如果未能解决你的问题,请参考以下文章
Tensorflow / Keras:规范化训练/测试/实时数据或如何处理现实?