YOLO模型和mtcnn模型对比,在做人脸识别时,有何不同?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了YOLO模型和mtcnn模型对比,在做人脸识别时,有何不同?相关的知识,希望对你有一定的参考价值。

脸进行比对从而达到识别的目的。

如MTCNN(Multi-task Cascaded Convolutional Neural Networks),MTCNN人脸识别的主要方法是:

当给定一张照片的时候,将其缩放到不同尺度形成图像金字塔,以达到尺度不变。

步骤1:使用P-Net生成候选窗和边框回归向量(bounding box regression vectors)。使用Bounding box regression的方法来校正这些候选窗,使用非极大值抑制(NMS)合并重叠的候选框。全卷积网络和FasterR-CNN中的RPN一脉相承;

步骤2:使用N-Net改善候选窗,将通过P-Net的候选窗输入R-Net中,拒绝掉大部分false的窗口,继续使用Bounding box regression和NMS合并;

步骤3:最后使用O-Net输出最终的人脸框和特征点位置。和第二步类似,但是不同的是生成5个特征点位置。

可以看出,MTCNN是使用分阶段的方式实现人脸检测及人脸对齐任务,即每一个阶段由一个网络组成,使用中需要对这些网络进行分阶段的训练,这样的识别方式显然不是一种端对端的学习方式,人脸识别效率慢。且网络泛化能力弱、鲁棒性差。追问

现在还有人用mtcnn吗?

参考技术A 识别技术是基于人的脸部特征,对输入的人脸图像或者视频流进行判断。首先判断是否存在人脸,如果存在,则进一步给出人脸所在的位置、大小。并根据这些信息进一步提取出人脸的特征信息,最后将其与已知的人脸对比,从而识别每个人脸的身份,总体来说,人脸的识别分为两大步骤,一是人脸的检测,二是人脸的对齐,人脸检测方面,目前人脸检测采用边框检测的方式,即利用网络学习将图像划分为若干边框,从若干边框中捕捉人脸,并提取出人脸的关键点信心,人脸的对齐则是将图像中的人脸与已知的人脸进行比对从而达到识别的目的。
如MTCNN(Multi-task Cascaded Convolutional Neural Networks),MTCNN人脸识别的主要方法是:
当给定一张照片的时候,将其缩放到不同尺度形成图像金字塔,以达到尺度不变。
步骤1:使用P-Net生成候选窗和边框回归向量(bounding box regression vectors)。使用Bounding box regression的方法来校正这些候选窗,使用非极大值抑制(NMS)合并重叠的候选框。全卷积网络和FasterR-CNN中的RPN一脉相承;
步骤2:使用N-Net改善候选窗,将通过P-Net的候选窗输入R-Net中,拒绝掉
参考技术B 步骤1:使用P-Net生成候选窗和边框回归向量(bounding box regression vectors)。使用Bounding box regression的方法来校正这些候选窗,使用非极大值抑制(NMS)合并重叠的候选框。全卷积网络和FasterR-CNN中的RPN一脉相承; 参考技术C 各有各的优点也各有各的缺点 参考技术D 2010年荣获

以上是关于YOLO模型和mtcnn模型对比,在做人脸识别时,有何不同?的主要内容,如果未能解决你的问题,请参考以下文章

Android之基于Facenet模型比对视频中的人脸

使用TensorRT对人脸检测网络MTCNN进行加速

使用 Emgucv 做人脸识别,显示没有预测结果

MTCNN实时人脸检测网络详解与opencv+tensorflow代码演示

Java可以做人脸识别吗

MTCNN人脸识别