Inception 模型有两个 softmax 输出吗?

Posted

技术标签:

【中文标题】Inception 模型有两个 softmax 输出吗?【英文标题】:Does the Inception Model have two softmax outputs? 【发布时间】:2017-01-14 02:15:59 【问题描述】:

Inception v3 模型如下图所示:

图片来自这篇博文:

https://research.googleblog.com/2016/03/train-your-own-image-classifier-with.html

似乎有两个 Softmax 分类输出。这是为什么呢?

TensorFlow 示例中使用哪一个作为该文件中名称为“softmax:0”的输出张量?

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/models/image/imagenet/classify_image.py

Inception v3 模型的学术论文似乎没有这个 Inception 模型的图像:

http://arxiv.org/pdf/1512.00567v3.pdf

我试图理解为什么网络的这两个分支具有看似两个不同的 softmax 输出。

感谢您的澄清!

【问题讨论】:

【参考方案1】:

您引用的paper 的第 4 节是关于辅助分类器。这些是添加到网络较低级别的分类器,通过减轻梯度消失问题和加速收敛来改进训练。要在经过训练的网络上运行推理,您应该使用模型中称为 softmax:0 的主分类器,而 NOT 使用称为 auxiliary_softmax:0 的辅助分类器。

【讨论】:

在提出问题之前,我已经阅读了该论文中的第 4 部分,并且确实想知道这是否是解释。但是我从第 4 节中得到的印象是它不是很有用,所以我认为它没有包含在 Inception 模型中。感谢您清理它!

以上是关于Inception 模型有两个 softmax 输出吗?的主要内容,如果未能解决你的问题,请参考以下文章

Softmax函数模型介绍

inception模型和卷积层的残差连接的keras实现

Softmax回归

softmax与logistic关系

Softmax回归

Softmax回归(转载)