第二十一篇 数据增强

Posted AI浩

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第二十一篇 数据增强相关的知识,希望对你有一定的参考价值。

摘要

这篇文章是对数据增强的总结。通过对数据增强可以使训练集更丰富,从而让模型更具泛化能力,减轻模型的过拟合。

比较常用的几何变换方法主要有:翻转,旋转,裁剪,缩放,平移,抖动。值得注意的是,在某些具体的任务中,当使用这些方法时需要主要标签数据的变化,如目标检测中若使用翻转,则需要将gt框进行相应的调整。

比较常用的像素变换方法有:加椒盐噪声,高斯噪声,进行高斯模糊,调整HSV对比度,调节亮度,饱和度,直方图均衡化,调整白平衡等。

还有一些特殊的增强手段,如Cutout,Mixup,CutMix等方法。

数据增强的作用

    1. 避免过拟合。当数据集具有某种明显的特征,例如数据集中图片基本在同一个场景中拍摄,使用Cutout方法和风格迁移变化等相关方法可避免模型学到跟目标无关的信息。
    1. 提升模型鲁棒性,降低模型对图像的敏感度。当训练数据都属于比较理想的状态,碰到一些特殊情况,如遮挡,亮度,模糊等情况容易识别错误,对训练数据加上噪声,掩码等方法可提升模型鲁棒性。
    1. 增加训练数据,提高模型泛化能力。
    1. 避免样本不均衡。在工业缺陷检测方面,医疗疾病识别方面,容易出现正负样本极度不平衡的情况,通过对少样本进行一些数据增强方法,降低样本不均衡

以上是关于第二十一篇 数据增强的主要内容,如果未能解决你的问题,请参考以下文章

Sklearn 与 TensorFlow 机器学习实用指南第二版

第二十一篇 jQuery 学习3 特效效果

深度学习-机器学习 第一篇

第二十一篇:伦理/道德Ethics

第二十一篇:伦理/道德Ethics

第二十一篇:伦理/道德Ethics