Convolutional Pose Machines(理解)

Posted czifan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Convolutional Pose Machines(理解)相关的知识,希望对你有一定的参考价值。

0 - 背景

  人体姿态识别存在遮挡以及关键点不清晰等主要挑战,然而,人体的关键点之间由于人体结构而具有相互关系,利用容易识别的关键点来指导难以识别关键点的检测,是提高关键点检测的一个思路。本文通过提出序列化结构模型,来提高人体姿态识别任务的效果。

1 - 整体思路

1.1 - CPM(Convolutional Pose Machines)

  Convolutional Pose Machines(CPM)算法思想来自于Pose Machine,其网络结果如下图:

技术分享图片

  图中(a)和(b)是pose machine中的结构,(c)和(d)是其对应的卷积网络结构,(e)展示了图片在网络中传输的不同阶段的感受野。

  • Stage 1:对输入图片做处理,其中$X$代表经典的VGG结构,并且最后采用$1 imes 1$卷积输出belief map,如果人体有$k$个关键带来,则$belief map$的通道数为$k$
  • Stage T:对于Stage 2以后的Stage,其结构都统称为Stage T,其输入为上一个Stage的输出以及对原始图片的特征提取的联合,输出于Stage 1一致

技术分享图片

1.2 - 损失函数

  损失函数公式如下:

2 - 实验

2.1 - intermediate supervision

  如果直接对整个网络进行梯度下降,输出层的误差经过多层反向传播会大幅减小,而发生梯度消失现象。

    技术分享图片

  本文为了解决这个问题,提出了中间监督方法,从而保证底层参数的正常更新。

    技术分享图片

  效果如下图,可以看到,加入中间监督之后,在靠近输入的stage,其梯度比没有中间监督大很多,从而保证学习的效果。

技术分享图片

2.2 - 感受野

 

3 - 参考资料

https://arxiv.org/abs/1602.00134

https://blog.csdn.net/cherry_yu08/article/details/80846146

https://blog.csdn.net/shenxiaolu1984/article/details/51094959

https://www.cnblogs.com/JillBlogs/p/9098989.html

 

以上是关于Convolutional Pose Machines(理解)的主要内容,如果未能解决你的问题,请参考以下文章

Kafka中错误:Unrecognized VM option ‘UseCompressedOops’ Error: Clould not create the Java Vritual Machin

The 'microsoft.jet.oledb.4.0' provider is not registered on the local machin

EXCEL数据匹配:The 'Microsoft.Jet.Oledb.4.0' provider is not registered on the local machin

GPS和LOAM的pose之间建立edge

robot_pose_ekf包保姆级使用教程

手眼标定中RT矩阵的欧拉角和Halcon中pose的类型之间的关系