在在线机器学习算法中将样本归一化为 0 均值和 1 方差
Posted
技术标签:
【中文标题】在在线机器学习算法中将样本归一化为 0 均值和 1 方差【英文标题】:Normalizing samples to 0 mean and 1 variance , in online machine learning algorithms 【发布时间】:2016-05-30 16:17:15 【问题描述】:我目前正在研究一种在线机器学习算法,我需要确保输入向量中的每个特征在样本中具有 0 均值和 1 方差。 我认为当您事先拥有所有样本时如何做到这一点很简单,但在线学习并非如此。 有谁知道如何以这种方式对新的给定向量进行归一化,以使先前样本(+新样本)中的每个特征都具有 0 均值和 1 方差? 有没有可能?
谢谢
【问题讨论】:
【参考方案1】:引导前几百个样本,估计均值和方差,并对均值 0 和方差 1 进行高斯归一化,并将任何未来向量归一化。没有 ML 算法对归一化到 0,1 非常严格,这应该就足够了。
对于从第一个缺陷开始学习的严格在线问题,我不知道该怎么做,除非您对变量的范围有一些想法,例如灰度图像中像素的最大值等。重新归一化和在收集每 x 个缺陷后重新训练将证明成本太高。
【讨论】:
以上是关于在在线机器学习算法中将样本归一化为 0 均值和 1 方差的主要内容,如果未能解决你的问题,请参考以下文章