使用 dlib 进行狗脸检测 - 需要有关改进 recal 的建议

Posted

技术标签:

【中文标题】使用 dlib 进行狗脸检测 - 需要有关改进 recal 的建议【英文标题】:Dog face detection with dlib - need advice on improving recal 【发布时间】:2017-01-16 19:27:10 【问题描述】:

我正在尝试使用 dlib 的猪金字塔检测器训练狗脸检测器。 我使用了哥伦比亚狗数据集:ftp://ftp.umiacs.umd.edu/pub/kanazawa/CU_Dogs.zip

起初我的召回率为 0%,但通过增加 C 值,我设法将其在训练集上增加到 62%,在测试集上增加到 53%。在某个点增加 C 值后停止帮助(1000+)并且只会减慢训练速度。

虽然精度确实很高,如果它真的能找到狗的脸,它总是正确的,没有看到任何误报。

您能否就如何将回忆提高到下降回忆质量提供任何建议?

提前致谢

更新: 按照 Davis King 的建议,仅通过为每个品种训练不同的检测器,就可以将训练集的准确率提高到 100%,测试集的准确率提高到 80%。我想如果我按照他们正在寻找的方向对它们进行聚类,它可能会更高。

【问题讨论】:

【参考方案1】:

您可能需要针对不同的头部姿势和看起来非常不同的狗训练不同的检测器。我会尝试使用 --cluster 选项运行 dlib 的 imglab 命令行工具。这会将图像聚集成连贯的姿势,您可以为每个姿势训练检测器。

【讨论】:

如果我错了,请纠正我,因为我是新手,但是 HOG 可能不是检测狗脸的好工具,因为它们的毛皮没有明显的形状? 我怀疑皮毛是个问题。不过,品种之间的姿势可变性和整体面部结构差异肯定是。 看起来你是对的——“检测用户注册的狗脸”论文使用 DPM。您能否就设置边界框提供一些额外的建议 - 您认为在整个头部周围有一个框更好还是在鼻子和眼睛周围有一个小得多的框(i.imgur.com/ABehiwd.png)?另外,因为狗脸一般都比较长,你觉得做一个像 60x80 这样更矩形的滑动窗口会更好,而不是默认的 80x80 吗? 数据集实际上也有 OBB(旋转框),但 dlib 仅适用于 AABB。旋转图片更好(但只有一个框可以容纳多只狗的图片)还是仅将 OBB 旋转为 AABB? 我会根据 --cluster 的输出训练多个检测器。除此之外,您应该尝试看看哪种方法最有效。

以上是关于使用 dlib 进行狗脸检测 - 需要有关改进 recal 的建议的主要内容,如果未能解决你的问题,请参考以下文章

使用 dlib 检测眼睛地标

dlib库包的介绍与使用,opencv+dlib检测人脸框opencv+dlib进行人脸68关键点检测,opencv+dlib实现人脸识别,dlib进行人脸特征聚类dlib视频目标跟踪

opencv联合dlib人脸检测例子二(加快检测)

opencv联合dlib人脸检测例子二(加快检测)

Dlib 中 .svm 文件和 .dat 文件之间的区别

使用dlib应用(HOG和CNN)进行人脸检测