『cs231n』图像定位与检测（下，待续）

Posted 2020-09-27

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了『cs231n』图像定位与检测（下，待续）相关的知识，希望对你有一定的参考价值。

图像检测原理

给出一张图片和几个类别，定位出图片中这些类所有的实例。

技术分享

由于输出数目不定，所以不能简单的把检测任务像定位任务一样归化为回归任务（检测任务会导致回归层神经元数目是不确定的）

技术分享

在机器学习中，分类和回归是解决所有问题的两种基本思路，所以我们尝试用分类的思想分析问题。

技术分享

思路是将所有可能分类的区域送入网络

问题是图片数量太多

直观的解决思路是换个速度快的电脑... ...

实际上新电脑还是不够快... ...

技术分享

那就只查看一些可能的区域（预处理）

技术分享

可以理解为一种不可知目标检测器，它不关心目标的具体类别，也并不精确，但是可以快速检测出大量选区。

它会寻找整体相似的结构，比如上面的狗被视为一大块白色，眼睛是个黑色小块之类。

技术分享

Selective Search是Region Proposals的一个经典实现，其原理就是：

技术分享

这里评估了各种Region Proposals方法，老师推荐EdgeBoxes方法。

技术分享

RCNN整合了图像检测原理中提到的Region Proposals，用于提取特征的卷积神经网络，用于绘制框的回归头，用于分类的SVM分类器，最终实现了检测任务。

技术分享

训练或下载一个卷积分类模型（比如AlexNet就行）。

技术分享

Fine-tune模型：

技术分享

保存样本图的特征：

技术分享

将上面的特征连同标签作为样本训练SVM分类器。

技术分享

以上是关于『cs231n』图像定位与检测（下，待续）的主要内容，如果未能解决你的问题，请参考以下文章