深度学习与图神经网络核心技术实践应用高级研修班-Day4基于深度学习的图像分类(image_classification)

Posted ZSYL

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习与图神经网络核心技术实践应用高级研修班-Day4基于深度学习的图像分类(image_classification)相关的知识,希望对你有一定的参考价值。


1. 图像分类任务

图像分类:根据图像的语义信息区分不同类别图像,是计算机视觉中重要问题,也是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。

应用:

  • 安防领域的人脸识别
  • 智能视频分析
  • 交通领域的交通场景识别
  • 基于内容的图像检索和相册自动归类
  • 医学领域的图像识别等。

2. 常用数据集及模型介绍

2.1 发展简介

ILSVRC(ImageNet Large Scale Visual Recognition Challenge):机器视觉领域最受追捧和最具权威的学术竞赛之一,代表了图像领域的最高水平。

图像分类挑战:

判断图片种的物体在1000个分类中所属的类别,采用top-5错误评估方式。

即对每张图给出5次猜测结果,只要5次由一次命中真实类别就算正确分类。

2.2 模型介绍

自2012年AlexNet问世至今,几乎每 年的ILSVRC大赛上都会有更加优秀模型出现。如:AlexNet、GoogLeNet、VGGNet、ResNet

常用数据集

  • CIFAR:http://www.cs.toronto.edu/~kriz/cifar.html
  • ImageNet:http://www.image-net.org/
  • MSCOCO:http://cocodataset.org/

3. 基于深度学习模型逻辑

3.1 基本算法过程

http://www.image-net.org/challenges/LSVRC/

3.2 多组卷积+激活+池化效果


http://www.image-net.org/challenges/LSVRC/

4. 模型及代码分析

4.1 AlexNet(2012)

AlexNet将LeNet的思想发扬光大,把CNN的基本原理应用到了很深很宽的网络中。

  • 首次在CNN中成功应用ReLU
  • Dropout
  • LRN
  • 使用了GPU进行运算加速
  • 数据增强





4.2 VGGNets(2014)

VGGNet是一个继承了AlexNet的思路,尝试建立层次更多、深度更深的网络。

其网络结构同样由8个层次构成,也是5组卷积层、3个全连接层。

主要的区别在于VGGNet的每个卷积层并不是一次卷积操作,而是连续卷积2~4次。



https://github.com/stephen-v/tensorflow_vgg_classify

4.3 ResNet(2015)

ResNet(Residual Neural Network)由微软研究院的Kaiming He等四名华人提出,通过使用ResNet Unit成功训练出了152层的神经网络,并在ILSVRC2015比赛中取得冠军,在top5上的错误率为3.57%,同时参数量比VGGNet低,效果非常突出。ResNet的结构可以极快的加速神经网络的训练,模型的准确率也有比较大的提升。同时ResNet的推广性非常好,甚至可以直接用到InceptionNet网络中。


但是直接让一些层去拟合一个潜在的恒等映射函数H(x) = x,比较困难,这可能就是深层网络难以训练的原因。但是,如果把网络设计为H(x) = F(x) + x,如下图。我们可以转换为学习一个残差函数F(x) = H(x) - x. 只要F(x)=0,就构成了一个恒等映射H(x) = x. 而且,拟合残差肯定更加容易。





5. 参考文献

[1] DE Rumelhart, GE Hinton, RJ Williams, Learning internal representations by error propagation. 1985 – DTIC Document.

[2] Y. LeCun , B. Boser , J. S. Denker , D. Henderson , R. E. Howard , W. Hubbard and L. D. Jackel, “Backpropagation
applied to handwritten zip code recognition”, Neural Computation, vol. 1, no. 4, pp. 541-551, 1989.

[3] Kaiming He, Deep Residual Learning, http://image-net.org/challenges/talks/ilsvrc2015_deep_residual_ learning_kaiminghe.pdf

[4] Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner. Gradient-based learning applied to document recognition.
Proceedings of the IEEE, 86(11):2278–2324, 1998.

[5] A. Krizhevsky, I. Sutskever, and G. Hinton. Imagenet classification with deep convolutional neural networks. In
Advances in Neural Information Processing Systems 25, pages 1106–1114, 2012.

[6] Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott E. Reed, Dragomir Anguelov, Dumitru Erhan,
Vincent Vanhoucke, Andrew Rabinovich: Going deeper with convolutions. CVPR 2015: 1-9

[7] Karen Simonyan, Andrew Zisserman: Very Deep Convolutional Networks for Large-Scale Image Recognition.
CoRR abs/1409.1556 (2014)

[8] Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Deep Residual Learning for Image Recognition. IEEE
Conference on Computer Vision and Pattern Recognition (CVPR), 2016

以上是关于深度学习与图神经网络核心技术实践应用高级研修班-Day4基于深度学习的图像分类(image_classification)的主要内容,如果未能解决你的问题,请参考以下文章

深度学习与图神经网络核心技术实践应用高级研修班-Day3迁移学习(Transfer Learning)

深度学习与图神经网络核心技术实践应用高级研修班-Day1典型深度神经网络模型

深度学习与图神经网络核心技术实践应用高级研修班-Day1Tensorflow和Pytorch

深度学习与图神经网络核心技术实践应用高级研修班-Day2基于Keras的深度学习程序开发

深度学习与图神经网络核心技术实践应用高级研修班-Day1受限波尔兹曼机和深度信念网络

深度学习与图神经网络核心技术实践应用高级研修班-Day4深度强化学习(Deep Q-learning)