pytorch学习笔记：卷积神经网络CNN（进阶篇）

Posted 2021-06-05 Z|Star

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了pytorch学习笔记：卷积神经网络CNN（进阶篇）相关的知识，希望对你有一定的参考价值。

文章目录

1、GoogleNet

在这里插入图片描述
如图是经典网络GoogleNet的网络结构图，如果将每层均用上篇内容的表示方法，则代码过于冗长。观察到网络结构中有很多重复部分，因此可以使用Class对重复部分进行封装。

2、重复部分封装

1.Concatenate

在这里插入图片描述
如图所示是GoogleNet中反复出现的网络结构，由于不清楚哪种网络结构的训练效果最好，因此分成多条支路分别进行训练，训练较好的支路的权重也会变大。Concatenate的作用就是将不同结果进行拼接。注：该拼接必须保证结果的长宽一致即W-H一致。

2.1*1卷积核

1.信息聚合

在上面的网络结构中，使用了多个1*1的卷积核，它的意义是信息的聚合。
在这里插入图片描述
上图中，使用了1*1卷积核之后，所获得的结果矩阵融合了三个通道的信息。例如，在考试科目中，计算总分进行比较，也是一种信息聚合。

2.简化计算

1*1卷积核另外一个作用是简化计算量。
在这里插入图片描述
如图的网络结构中，使用11卷积核之后，计算量减小到了原来的1/10，主要原因是11卷积核能够直接改变通道的数量。

3、程序书写

在这里插入图片描述
注意，由于要保证所有输出的长宽一致，因此要在部分卷积核中合理设置padding数值，padding数值怎么设，参考本专栏上一篇文章。

拼合结果如图所示，不同块的结果长宽一致，通道数可以不一致。

拼接使用torch.cat，dim=1代表沿着第二个维度拼接。维度是【b,c,w,h]，第二个即为channel。