神经网络中预测数据的非规范化

Posted

技术标签:

【中文标题】神经网络中预测数据的非规范化【英文标题】:Denormalization of predicted data in neural networks 【发布时间】:2015-12-29 12:55:59 【问题描述】:

在神经网络中,用于训练数据的样本数量为 5000,在给定数据用于训练之前,使用公式对其进行归一化

     y - mean(y)
y' = -----------
      stdev(y)

现在我想在获得预测输出后对数据进行反规范化。通常用于预测的测试数据数据是 2000 个样本。为了去规范化,使用以下公式

y = y' * stdev(y) + mean(y)

此方法取自以下线程 [How to denormalise (de-standardise) neural net predictions after normalising input data

谁能解释我如何使用相同的均值和标准差来规范化训练数据 (5000*2100) 可以用于对预测数据进行反规范化,正如您所知道的预测测试数据 (2000*2100) 所使用的那样,两个计数都不同。

【问题讨论】:

态度不好——但我确实忽略了对您的问题进行投票。对不起,疏忽。另外,我刚刚发现了我的提醒的样子:我是这个问题的唯一答案。 [脸红] 【参考方案1】:

反规范化方程是简单的代数:它与归一化方程相同,但求解的是 y 而不是 y'。作用是反转归一化过程,恢复原始数据的“形状”;这就是为什么你必须使用原始的 stdev 和 mean。

归一化是将数据转移到以 0 为中心(使用均值),然后将分布压缩到标准正态曲线(对于 1.0 的新标准差)的过程。要恢复到原始形状,您必须取消移动和取消压缩与原始分布相同的 数量。

请注意,我们预计预测数据的平均值为 0,stdev 约为 1.0(由于集中趋势定理,变化会有一些变化)。你的担心并不傻:我们确实有不同的标准开发人口数。

【讨论】:

以上是关于神经网络中预测数据的非规范化的主要内容,如果未能解决你的问题,请参考以下文章

在时间序列分类问题中规范化数据 - 递归神经网络

Pandas 中的非标准化数据框

用C实现单隐层神经网络的训练和预测(手写BP算法)

2019年网络安全最佳实践规范

手把手教你搭建神经网络(回归)

在RBF神经网络预测中,如果样本数据较少时,效果怎么样?和GRNN神经网络比较