小型图像数据集的数据增强技术?
Posted
技术标签:
【中文标题】小型图像数据集的数据增强技术?【英文标题】:Data augmentation techniques for small image datasets? 【发布时间】:2016-07-08 18:51:12 【问题描述】:目前我正在使用深度 CNN 训练类似于 Flickrlogos-32 的小型徽标数据集。为了训练更大的网络,我需要更多的数据集,因此使用增强。我现在正在做的最好的事情是使用仿射变换(特征归一化、特征中心、旋转、宽度高度偏移、水平垂直翻转)。但是对于更大的网络,我需要更多的增强。我尝试在 kaggle 的国家数据科学碗的forum 上进行搜索,但没有得到太多帮助。给出了here 的某些方法的代码,但我不确定什么有用。除了仿射变换之外,还有哪些其他(或更好的)图像数据增强技术可以应用于此类(或任何一般图像)数据集?
【问题讨论】:
【参考方案1】:可以在here,关于数据增强的第 1 部分找到一个很好的回顾:即翻转、随机裁剪和颜色抖动和还有灯光噪音:
Krizhevsky et al. 在 2012 年训练著名的 Alex-Net 时提出了花式 PCA。花式 PCA 改变了训练图像中 RGB 通道的强度。
另外,您还可以看看 Kaggle Galaxy Zoo 挑战赛:获胜者写了very detailed blog post。它涵盖了相同的技术:
旋转, 翻译, 缩放, 翻转, 颜色扰动。如前所述,他们也“实时,即在训练期间”这样做。
例如这里是一个实用的Torchimplementation 由 Facebook (用于ResNet 培训)。
【讨论】:
【参考方案2】:我在my masters thesis, page 80 中收集了一些增强技术。它包括:
缩放, 作物 翻转(水平/垂直) 旋转 缩放 剪毛 频道转换(rgb、hsv) 对比 噪音, 渐晕【讨论】:
以上是关于小型图像数据集的数据增强技术?的主要内容,如果未能解决你的问题,请参考以下文章