在在线机器学习算法中将样本归一化为 0 均值和 1 方差

Posted

技术标签:

【中文标题】在在线机器学习算法中将样本归一化为 0 均值和 1 方差【英文标题】:Normalizing samples to 0 mean and 1 variance , in online machine learning algorithms 【发布时间】:2016-05-30 16:17:15 【问题描述】:

我目前正在研究一种在线机器学习算法,我需要确保输入向量中的每个特征在样本中具有 0 均值和 1 方差。 我认为当您事先拥有所有样本时如何做到这一点很简单,但在线学习并非如此。 有谁知道如何以这种方式对新的给定向量进行归一化,以使先前样本(+新样本)中的每个特征都具有 0 均值和 1 方差? 有没有可能?

谢谢

【问题讨论】:

【参考方案1】:

引导前几百个样本,估计均值和方差,并对均值 0 和方差 1 进行高斯归一化,并将任何未来向量归一化。没有 ML 算法对归一化到 0,1 非常严格,这应该就足够了。

对于从第一个缺陷开始学习的严格在线问题,我不知道该怎么做,除非您对变量的范围有一些想法,例如灰度图像中像素的最大值等。重新归一化和在收集每 x 个缺陷后重新训练将证明成本太高。

【讨论】:

以上是关于在在线机器学习算法中将样本归一化为 0 均值和 1 方差的主要内容,如果未能解决你的问题,请参考以下文章

机器学习算法在什么情况下需要归一化

机器学习常用算法思想

如何将信号归一化为零均值和单位方差?

机器学习--感知器数据分类算法步骤(慕课网-实现简单的神经网络)

一些常用的机器学习算法实现

学机器学习要学一些什么?机器学习和深度学习项目实战分享