行人重识别计算机视觉进阶系列 第一课 基础知识

Posted 我是小白呀

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了行人重识别计算机视觉进阶系列 第一课 基础知识相关的知识,希望对你有一定的参考价值。

【行人重识别】🖐计算机视觉进阶系列🖐 第一课 基础知识

概述

行人重识别 (Person Re-Identification) 是利用计算机视觉技术判断图片或视频中是否存在特定行人的技术. 行人重识别技术可以帮助我们在多摄像头的复杂场景中快速定位查找到指定目标的所有结果. 行人重识别技术在智能安防, 监控等领域有者巨大的前景. 今天小白就带大家来一起学习一下行人重识别的技术.

行人重识别

行人重识别 (Person Re-Identification) 是利用计算机视觉技术判断图片或视频中是否存在特定行人的技术.


行人重识别面临的挑战:

  1. 图像分辨率低
  2. 遮挡
  3. 视角, 姿势变化
  4. 光照变化
  5. 视觉模糊性

rank-1

rank-1 即预测最高概率的标签与真实标签占比的百分比, 即第一张返回的图像正确的百分比. 例如, 模型识别了 100 只猪, 但实际上, 里面 90 只是猪, 10 只是大象. rank-1 的值就为 90/100 = 90%.

mAP

mAP (Mean Average Precision) 即 AP 的平均值.

ap 的计算过程:

  • 找到第一张返回图片正确的位置, 取得 P r e c i s i o n 1 = i n d e x p 1 i n d e x t o t a l Precision_1 = \\frac index_p1 index_total Precision1=indextotalindexp1
  • 找到第二章返回图片正确的位置, 取得 P r e c i s i o n 2 = i n d e x p 2 i n d e x t o t a l Precision_2 = \\frac index_p2 index_total Precision2=indextotalindexp2
  • 重复以上步骤, 取得 A P = P r e c i s i o n 1 + P r e c i s i o n 2 + . . . + P r e c i s i o n n n AP = \\frac Precision_1 + Precision_2 + ... + Precision_n n AP=nPrecision1+Precision2+...+Precisionn

损失函数

行人重识别通常使用的函数为分类损失 + Triplet Loss, 增加 Triplet 可以使得特征提取的更好. 下面我们就分别来讲解一下.

交叉熵

交叉熵 (Cross Entropy) 是分类任务最常用的一种损失, 可以帮助我们求得目标与预测值之间的差距. 关于交叉熵的具体推导流程请大家自行百度, 在这里就不过多赘述.

Triplet Loss

Triplet Loss 是深度学习的一种损失函数, 主要用于训练差异性小的样本.

Triplet Loss 由三个部分组成, 分别为:

  1. 锚 (Anchor): 当前数据
  2. 正示例 (Positive): 和锚为同一人的数据
  3. 负示例 (Negative): 和锚为不同人的数据

Triplet Loss 计算流程:

  1. 分别对三份数据进行编码
  2. 分别将三份数据经过相同的网络
  3. 计算三份数据之间的差异
  4. 通过差值来更新权重参数

Triplet Loss 训练的目标是拉近锚 (Anchor) 与正示例 (Positive) 的距离, 拉远锚 (Anchor) 与负示例 (Negative) 的距离.

Triplet Loss 公式:

∣ ∣ f ( A ) − f ( P ) ∣ ∣ 2 − ∣ ∣ f ( A ) − f ( N ) ∣ ∣ 2 + a ≤ 0 || f(A) - f(P)||^2 - || f(A) - f(N)||^2 + a \\le 0 f(A)f(P)2f(A)f(N)2+a0

我们可以看到
公式中存在一个 a a a, 也被称作间隔 (Margin), 表示 d(A, P) 与 d(A, N) 至少相差多少, 从而避免模型走捷径将正示例和负示例的距离训练的相等.

Hard Negative

Hard Negative 即难以正确分类的样本. 在行人重识别中, 我们会尽量挑选和正示例相近的负示例 d(A, P) ≈ \\approx d(A, N), 从而使模型多进行训练以达到更好的效果.

以上是关于行人重识别计算机视觉进阶系列 第一课 基础知识的主要内容,如果未能解决你的问题,请参考以下文章

行人重识别计算机视觉进阶系列 第一课 基础知识

跨膜态行人重识别 综述,查阅许多资料,详细解释,适合以前没有基础的同学学习。

专知荟萃26行人重识别 Person Re-identification知识资料全集(入门/进阶/论文/综述/代码,附查看)

视频行人重识别系统(UI界面,Python源码,可下载)

深度学习行人重识别综述与展望,TPAMI 2021 最新文章

CVPR2021 行人重识别/Person Re-identification 论文+开源代码汇总