34统计基础- 分位数标准化(Quantile Normalization)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了34统计基础- 分位数标准化(Quantile Normalization)相关的知识,希望对你有一定的参考价值。

参考技术A

假设我们有一些来自微阵列实验的数据

如果你不熟悉微阵列,这里有解释:

因此,我们需要标准化数据来解释实验之间的技术差异,这与生物学无关。

这是我们的数据。在这张图中,每种颜色代表一个不同的基因。这些颜色与实际微阵列实验中扫描到的颜色不同。此时,那些颜色已经转换为强度值。每个样本都有不同的平均值,这表明我们需要对不同的整体光强进行补偿。 分位数标准化(Quantile Normalization) 纠正了这个技术。

分位数标准化(Quantile Normalization) 后,每个样本的值都相同,但是原始的基因顺序被保留了下来。他们称之为“Quantile Normalization”,因为标准化的数据集有分位数相同。

以上是关于34统计基础- 分位数标准化(Quantile Normalization)的主要内容,如果未能解决你的问题,请参考以下文章

R语言统计函数:均值meanmedian中位数sd标准差var方差mad中位数绝对偏差quantile分位数range范围(起始值结束值)sum加和diff数据差分scale标准化

分位数(quantile)

数据分析师-pandas统计基础

R语言使用scale函数对数据进行标准化(标准正态化)计算数据的行平均值(row means)cbind函数纵向拼接到原dataframe中使用quantile函数计算分位数(2,4,6,8)

R语言使用scale函数对数据进行标准化(标准正态化)计算数据的行平均值(row means)cbind函数纵向拼接到原dataframe中使用quantile函数计算分位数(2,4,6,8)

pandas使用groupby函数计算dataframe数据中每个分组的N个数值的滚动分位数(rolling quantile)例如,计算某公司的多个店铺每N天(5天)的滚动销售额分位数