图像分类任务介绍 Image Classification
Posted BoyCZ
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了图像分类任务介绍 Image Classification相关的知识,希望对你有一定的参考价值。
目录
一、什么是图像分类任务?它有哪些应用场景?
图像分类任务是计算机视觉中的核心任务,其目标是 根据图像 信息中所反映的不同 特征 ,把不同类别的 图像区分 开来。 图像分类:从已知的类别标签集合中为给定的输入图片选定一个类别标签(标签:狗,猫,卡车,飞机,...)。 例如我们分别将下面两张图片分类成狗、绿玉藤:二、图像分类任务的难点?
对于人来说,完成上述的图像分类任务简直轻而易举,我们看到的是图像,但对于机器也就是计算机来说,它看到的是字节数据:
因此,出现同一图像的视角不同(比如旋转一张图片)、光照不同(从不同的角度照射统一物体),物体的尺度大小不同(小孩拿着电脑与姚明拿着电脑),物体被遮挡,物体形变(猫站着、躺着......),图像背景出现杂波(北极狐与背景融为一体),类内形变(都是椅子但却有很多样式),运动模糊(小鸟摆头导致拍摄时出现模糊)......这些情况时,对于机器来说,分类任务是很困难的。
三、基于规则的方法是否可行?
基于规则就是人来提取特征,人来描述图像,通常采用硬编码的方式,与机器学习无关,此种基于规则的方法也是不可行的,所以这里不再赘述,大家也不需要去了解。
四、什么是数据驱动的图像分类范式?
数据驱动的图像分类方法是指通过构建数据集并设计一个分类器,让分类器去学习数据集中的规律,将学习后的分类器用于图像分类,看不懂没关系,下面我们详解。数据驱动的图像分类方法有三个步骤:数据集构建、分类器设计与学习、分类器决策。
-
数据集构建
例如我们将10000张猫和10000张狗的图片收集在一起,并分别为其打上标签(狗的标签可打为1,猫的标签可打为2),这就是数据集构建。 -
分类器设计与学习
分类器设计就是设计一个模型,例如逻辑回归模型、ResNet等,分类器学习就是将模型的参数填上(最开始都是随机填)并不断更新(最开始填的肯定不好,所以要让计算机帮我们更新参数)以使得我们设计的模型能以更高的准确率来分类图像,这个参数更新的过程就是学习。 -
分类器决策
分类器决策就是将学习完毕的模型用于实际的分类任务中,这应该很好理解。
其中最重要的就是分类器设计与学习(下面的图看不懂没关系,待我的下一篇笔记更新基本就懂了):
五、常用的分类任务评价指标是什么?
- 正确率(accuracy)= 分对的样本数/全部样本数
- 错误率(error rate) = 1 – 正确率
- Top1指标:分类器对某一幅有小猫的图像输出的预测结果为[猫,狗,车,树,梨],其第一个预测结果是猫,则预测正确,若输出结果为 [狗,猫,车,树,梨],因为第一个预测结果不是猫,即使第二个预测结果正确,最终预测结果都算错误。
- Top5指标:只要输出的5个预测结果中有一个是正确的,那就算预测正确。所以不管是[猫,狗,车,树,梨]还是[狗,猫,车,树,梨],都算预测正确。
感谢您的阅读,若您认可我写的文章,麻烦帮忙点个赞,谢谢!
I am BoyCZ
以上是关于图像分类任务介绍 Image Classification的主要内容,如果未能解决你的问题,请参考以下文章
CS231n 学习笔记 Image CLassification