图像分类的深度神经网络模型综述

Posted 人工智能博士

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了图像分类的深度神经网络模型综述相关的知识,希望对你有一定的参考价值。

点上方人工智能算法与Python大数据获取更多干货

在右上方 ··· 设为星标 ★,第一时间获取资源

仅做学术分享,如有侵权,联系删除

转载于 :中国图象图形学报

图像分类是计算机视觉中的一项重要任务,传统的图像分类方法具有一定的局限性。随着人工智能技术的发展,深度学习技术越来越成熟,利用深度卷积神经网络对图像进行分类成为研究热点,图像分类的深度卷积神经网络结构越来越多样,其性能远远好于传统的图像分类方法。本文立足于图像分类的深度卷积神经网络模型结构,根据模型发展和模型优化的历程,将深度卷积神经网络分为经典深度卷积神经网络模型、注意力机制深度卷积神经网络模型、轻量级深度卷积神经网络模型和神经网络架构搜索模型等4类,并对各类深度卷积神经网络模型结构的构造方法和特点进行了全面综述,对各类分类模型的性能进行了对比与分析。虽然深度卷积神经网络模型的结构设计越来越精妙,模型优化的方法越来越强大,图像分类准确率在不断刷新的同时,模型的参数量也在逐渐降低,训练和推理速度不断加快。然而深度卷积神经网络模型仍有一定的局限性,本文给出了存在的问题和未来可能的研究方向,即深度卷积神经网络模型主要以有监督学习方式进行图像分类,受到数据集质量和规模的限制,无监督式学习和半监督学习方式的深度卷积神经网络模型将是未来的重点研究方向之一;深度卷积神经网络模型的速度和资源消耗仍不尽人意,应用于移动式设备具有一定的挑战性;模型的优化方法以及衡量模型优劣的度量方法有待深入研究;人工设计深度卷积神经网络结构耗时耗力,神经架构搜索方法将是未来深度卷积神经网络模型设计的发展方向。

http://www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20211001&flag=1

图像分类是计算机视觉基本任务之一。顾名思义,图像分类即给定一幅图像,计算机利用算法找出其所属的类别标签。图像分类的过程主要包括图像的预处理、图像的特征提取以及使用分类器对图像进行分类,其中图像的特征提取是至关重要的一步。传统的图像分类算法提取图像的色彩、纹理和空间等特征(孙君顶和赵珊,2009),其在简单的图像分类任务中表现较好,但在复杂图像分类任务中表现不尽人意。

随着智能信息时代的来临,深度学习(LeCun等,2015)应运而生。深度学习作为机器学习的一个分支,旨在模拟人类的神经网络系统构建深度人工神经网络,对输入的数据进行分析和解释,将数据的底层特征组合成抽象的高层特征,其在计算机视觉、自然语言处理等人工智能领域发挥了不可替代的作用。作为深度学习的典型代表,深度卷积神经网络(deep convolutional neural network,DCNN)在计算机视觉任务中大放异彩,与人工提取特征的传统图像分类算法相比,卷积神经网络使用卷积操作对输入图像进行特征提取,有效地从大量样本中学习特征表达,模型泛化能力更强。

2012年,AlexNet(Krizhevsky等,2012)大幅提升了图像分类等任务的性能,并取得了ImageNet(Deng等,2009)挑战赛冠军,使深度卷积神经网络逐渐成为计算机视觉领域研究的热点。随着DCNN网络结构越来越深,性能越来越强,过拟合、梯度消失、模型参数量巨大和难以优化等问题也越来越突出,科研人员针对不同的问题提出了不同结构的DCNN模型。

现有深度卷积神经网络综述的内容较为宽泛,不聚焦某一特殊任务,往往围绕深度卷积神经网络模型不同方面的优化方法与应用进行综述(林景栋等,2020;Gu等,2018;Khan等,2019;张顺等,2019)。

本文以图像分类任务为载体,从经典深度卷积神经网络模型、注意力机制卷积神经网络模型、轻量级卷积神经网络模型以及神经网络架构搜索模型4个方面,综述深度卷积神经网络基础模型近年来的研究进展,分析和对比主要的深度卷积神经网络模型,并对深度卷积神经网络模型设计未来可能的发展方向进行展望。

---------♥---------

声明:本内容来源网络,版权属于原作者

图片来源网络,不代表本公众号立场。如有侵权,联系删除

AI博士私人微信,还有少量空位

如何画出漂亮的深度学习模型图?

如何画出漂亮的神经网络图?

一文读懂深度学习中的各种卷积

点个在看支持一下吧

以上是关于图像分类的深度神经网络模型综述的主要内容,如果未能解决你的问题,请参考以下文章

最新成果深度卷积神经网络图像识别模型对抗鲁棒性技术综述

利用神经网络进行文本分类算法综述(持续更新中)

深度学习时代的图模型,清华发文综述图网络

综述 | 小样本深度学习图像识别

深度网络模型压缩综述

TAMU发布《图神经网络可解释》综述论文,14页pdf阐述实例级与模型级解释