用于训练 CNN 网络进行回归任务的正态分布数据
Posted
技术标签:
【中文标题】用于训练 CNN 网络进行回归任务的正态分布数据【英文标题】:Normally distributed data to train CNN network for regression task 【发布时间】:2018-08-16 04:16:50 【问题描述】:我正在为正态分布数据的回归任务训练一个 CNN 模型。
大多数数据点的取值在 0.4 和 0.6 之间。网络会学习小于 0.4 和大于 0.6 的数据点的特征吗?
我也不想使分布均匀,因为我希望网络学习训练数据的分布。
【问题讨论】:
【参考方案1】:模型学习你训练的任何东西。如果您使用某些特定类型的数据点进行更多训练,模型会很好地学习它们。在您的情况下,该模型更有可能在 0.4 到 0.6 范围内的数据点上表现良好。模型在位于正态曲线尾部的数据点类型上表现更好的可能性很小。
为了让模型更好地了解正态曲线尾部的点,您需要扩充数据集以平衡它。您可以做的其他事情是对尾部区域的数据点使用加权损失。
【讨论】:
澄清一下,我的问题不在于标准化数据。我想知道当我进行回归时神经网络是否可以学习具有高斯分布的数据点,因为大多数数据点都聚集在中心周围。它会学习尾部数据点的特征吗? 感谢您的回复。有没有办法在 keras 中使用加权损失来获取连续值。我知道我们可以在为分类任务执行时为特定类指定权重。 我不记得它的确切方式,但它可以完全变成一个不同的问题。希望我的回答对你有所帮助。如果是,请标记为已接受。以上是关于用于训练 CNN 网络进行回归任务的正态分布数据的主要内容,如果未能解决你的问题,请参考以下文章
注意力机制 | CNN-BiLSTM-Attention基于卷积-双向长短期记忆网络结合注意力机制多输入单输出回归预测(Matlab程序)