《工业机器视觉检测123》（1.3）目标检测问题记录

Posted 2023-03-31 图 (TU商兴)

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了《工业机器视觉检测123》（1.3）目标检测问题记录相关的知识，希望对你有一定的参考价值。

待研究方向。。。。。。

（1）基于MMlab 或者pytorch，跟踪并导入最新模型。

（2）基于最新模型，根据实际应用场景的数据集，进行对比测试，并调优

（3）根据实际应用场景搭建无监督模型。

（4）数据增强和极小目标检测研究。

检测极小目标检测（ COCO 数据集定义小于 32x32 pix 的为小目标，我们这里把小于10*10pix的目标定义为极小目标）

（1）训练和推理时将大分辨率图切割成小图（例如切割为320*320），模型输入分辨率设置为640*640，甚至更大。

（2）降低极小目标和大目标的类间不平衡。锚框设计难以获得平衡小目标召回率与计算成本之间的矛盾，而且这种方式导致了小目标的正样本与大目标的正样本极度不均衡，使得模型更加关注于大目标的检测性能，从而忽视了小目标的检测。

（3）减小数据集里面同一类别里面目标特征的差异，例如将线状特征，点状特征，椭圆状特征的异物都标注为异物，这样是错误的，可以将其分别标注为线状异物，点状异物，椭圆状异物。

减小数据集里面同一类别里面标注框长宽比及感受野的差异，例如同样形状的圆形异物，有的标注为长宽比为3：2 ，有的标注为5：2；或者有的紧贴异物标注，有的标注框里一半为背景区域。这样都给训练精度带来挑战。

以下待尝试。。。

（4）减小下采样率
比如对于 YOLOv5 的 stride 为 32，可以调整其 stride 来减小下采样率，从而保留某些比较小的特征。

（5）SPP 模块
增加感受野，对小目标有效果，SPP size 的设置解决输入 feature map 的size 可能效果更好

欢迎对极小目标检测感兴趣的朋友留言讨论！

机器视觉的主要研究内容和细分方向（超全超赞）

图像与视频
人体技术相关
人脸技术相关
主要软件工具
- OpenCV
- TensorFlow
- PyTorch
- PIL
- SKI-Image
- Matlab
主要数据集

非常完整的机器视觉研究方向总结，按技术原理、按应用场景进行划分。

转自：http://studyai.com/article/70f86341

PS: 若MarkDown不支持 TOC 和 TOCM 标题预览，可访问上述地址，分类结构更加清晰。

[TOCM]

图像与视频

图像处理

图像分类

单标签分类、多标签分类、细粒度分类

目标检测与分割

检测定位、语义分割、实例分割、全景分割

图像超分辨重建

图像恢复与增强

去雾、去雨、增强

图像问答和描述

图像与视频检索

视频内容分析

视觉目标跟踪

图神经网络GNN

生成对抗 GAN

AutoML & NAS

自动机器学习，神经架构搜索

网络压缩与轻量化

双目多目视觉

多源融合视觉

可见光成像、红外线成像、雷达波成像

医学影像分析

识别、重建、分割、配准

遥感与航空影像分析

工业视觉检测

缺陷检测、共件计数、尺寸测量

智能无人驾驶

车道线检测，交通标志检测、车辆检测、车牌号识别、车辆属性识别，ADAS等

SLAM与机器人

自主定位、导航与即时地图构建

三维点云和3D重建

人体技术相关

人体指纹识别

人体手势识别

人体姿态估计

人体动作检测

人体配装换装

人体服装搭配、穿衣风格定型、人体服装交换等

行人检测与识别

行人检测、行人重识别ReID、步态识别、人群计数

人脸技术相关

人脸美颜

人脸检测

人脸对齐

人脸验证

人脸检索

属性识别

表情识别

活体检测

人脸交换

虹膜识别

主要软件工具

OpenCV

TensorFlow

PyTorch

PIL

SKI-Image

Matlab

主要数据集

下图所示为一部分数据集

技术图片

全部数据集，可公众号内回复 dataset 后下载，

** 亲亲一扫，随时可查 **

技术图片

以上是关于《工业机器视觉检测123》（1.3）目标检测问题记录的主要内容，如果未能解决你的问题，请参考以下文章

机器视觉系统有啥功能？

机器视觉定位是啥？和机器视觉检测有啥不同？

机器视觉——医学检测

机器视觉的主要研究内容和细分方向（超全超赞）

机器视觉系统在机器人中主要都有哪些功能？