OpenMMlab AI实战营 打卡笔记DAY4
Posted harry trolor
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了OpenMMlab AI实战营 打卡笔记DAY4相关的知识,希望对你有一定的参考价值。
part1 目标检测
在计算机视觉众多的技术领域中,目标检测是一项非常基础的任务,图像分割、物体追踪、关键点检测等通常都要依赖于目标检测。概括来说即是对图像中感兴趣的物体进行类别预测与分类。
传统的目标检测分为三个阶段:目标区域选取,特征提取与目标分类
(1)目标框选取:通过移动窗遍历图像区域,同时用分类模型识别窗口内容
缺点:进行了大量的冗余计算,耗时耗力
改进:①使用selective search算法,利用图像分割产生初始区域,再利用相似度进行域合
(减少了冗余的计算,但是仍旧非常耗时)
②使用卷积网络实现密集预测。
用卷积一次性计算所有特征,再取出对应位置的特征完成分类。这样在特征图上滑窗,重叠区域值计算一次卷积特征,与窗的个数无关。然后在特征图上进行密集预测;密集预测实际上是一种隐式的滑窗方法,计算效率远高于滑窗。
(2)特征提取:在得到物体位置后,通常使用人工精心设计的提取器进行特征提取,如SIFT和HOG等。由于提取器包含的参数较少,并且人工设计的鲁棒性较低,因此特征提取的质量并不高。
(3)目标分类
part2 相关概念
①交并比
交并比(IoU)定义为两矩形框交集面积与并集面积之比,是矩形框重合程度的衡量指标
②置信度
模型认可自身预测结果的程度,通常需要为每个框预测一个置信度。大部分算法取分类模型预测物体属于特定类别的概率,部分算法让模型独立于分类单独预测一个置信度。我们倾向认可置信度高的预测结果。
③非极大值抑制
滑窗类算法通常会在物体周围给出多个相近的检测框 这些框实际指向同一物体,只需要保留其中置信度最高的.
④准确率和召回率
以上是关于OpenMMlab AI实战营 打卡笔记DAY4的主要内容,如果未能解决你的问题,请参考以下文章