如何增加数据集?

Posted

技术标签:

【中文标题】如何增加数据集?【英文标题】:How to increase the dataset? 【发布时间】:2016-08-26 10:28:22 【问题描述】:

我正在做一个关于人脸识别的项目。我有一个包含 21 个演员(每个 150 个)的图像的数据集。现在我想增加编号。为培训目的,每个演员的形象达到 300+。我怎样才能使用 MATLAB 来做到这一点。一些解决方案可以是我们可以改变每个图像的对比度/亮度级别。但是我可以通过哪些其他因素来增加数量。图片。

【问题讨论】:

【参考方案1】:

您可以选择翻转图像:如果一个人向右看,翻转后他会向左看。

此外,根据您可能使用的工具包和技能集,您可以做一些更高级的技术。如果你能从图片中找到一些有趣的特征,比如:眼睛、鼻子、嘴巴、背景。有了这些,您可以进行一些智能转换 - 交换人们的眼睛、改变背景、切换鼻子。

您还可以扭曲面部的某些特定对象 - 例如眼睛和鼻子 - 拉伸它们。也许对于大胆的人,你可以制作一些合成头发,等等......

您可以更改对比度/亮度级别,但通常效果不佳,因为您的功能可能(几乎)与它没有任何关系,因此它只是您数据的重复.

无论如何,由于它不是一个非常大的数据集,如果您没有一套技能来提取我提出的更多高级选项,或者没有时间处理它,您可以手动制作其中的一些东西。它不会像你想象的那样花费你。通常,有了这么多的数据,这将大大提升您的结果。

【讨论】:

【参考方案2】:

您正在寻找的内容称为“数据增强”。常见的变换是镜像(图像的左/右翻转)和图像的旋转。您还可以缩放(裁剪)图像的一部分。

【讨论】:

【参考方案3】:

也许带有旋转的缩放版本可能会有所帮助。如果您的功能对闪电对比等变化不具有鲁棒性,您可以相应地修改图像。

【讨论】:

以上是关于如何增加数据集?的主要内容,如果未能解决你的问题,请参考以下文章

mybatis mapper定义返回结果集时,如何增加不对应数据库字段的字段

r语言如何输出数据集过长,导致输出截断,怎么解决这个问题

什么是维度诅咒?如何评估降维算法在当前任务数据集上的效果?

scikit-learn:随着数据集增加的层次凝聚聚类性能

ppddledetection 参数增加数据集路径

学习曲线:训练集大小应该逐步增加还是随机选择?