如何用小数据集训练神经网络或如何在没有人工干预的情况下制作大数据集?

Posted

技术标签:

【中文标题】如何用小数据集训练神经网络或如何在没有人工干预的情况下制作大数据集?【英文标题】:How to train the neural network with small dataset or how to make huge dataset without human intervention? 【发布时间】:2016-03-11 01:17:07 【问题描述】:

我正在尝试使用 RNN 训练机器人进行特定动作,例如抓握或指向。 该机器人由一条手臂和一个装有摄像头的头部组成。工作区也将是小桌子,以便可以定位手臂和物体。 循环神经网络的输入将是相机每个时间步长的图像帧,输出将是机器人手臂下一帧的目标电机角度。 当当前图像帧被馈送到网络时,网络为下一帧输出 arm 的运动值。当手臂到达下一个位置时,该位置的输入帧再次进入网络,并再次产生下一个电机输出。

但是,在制作训练数据时,我必须为工作区上的所有位置制作(图像,电机角度)对的所有数据。尽管网络本身可以做一些泛化工作,但所需的数据仍然太多,而且由于轨迹太多,需要花费大量时间。

概括我遇到的问题,获取网络训练数据的时间太多了。有什么方法可以用小数据集训练网络吗?还是在相对较小的人工干预下制作庞大的数据集?

【问题讨论】:

【参考方案1】:

您的问题非常广泛,而且肯定涵盖的不仅仅是研究领域。这个问题在这个平台上无法回答,但是,我建议你在 gitHub 上查看这个compilation of Machine Learning Resources,特别是数据分析部分。

与您的问题相关的更具体的资源是DeepNeuralClassifier。

【讨论】:

【参考方案2】:

我搜索了更多论文,发现了一些与该主题相关的论文。我的问题的主要主题是

    找到用小数据集高效训练网络的方法 想办法用很少的人力来制作庞大的数据集

有一些论文,其中两篇对我帮助很大。这是链接。

Explanation-Based Neural Network Learning for Robot Control

Supersizing Self-supervision: Learning to Grasp from 50K Tries and 700 Robot Hours

【讨论】:

以上是关于如何用小数据集训练神经网络或如何在没有人工干预的情况下制作大数据集?的主要内容,如果未能解决你的问题,请参考以下文章

如何用小样本训练高性能深度网络

如何用DETR(detection transformer)训练自己的数据集

智能写作v2.0

2. PyTorch简介:使用PyTorch训练第一个神经网络

如果涉及权限调整数据修改流程干预需要在哪里提交工单

既然文字表你心,如何用深度学习读懂你的情?