如何计算相关值的平均值？

Posted 2023-03-12

技术标签:

【中文标题】如何计算相关值的平均值？【英文标题】：How to compute the average of correlated values? 【发布时间】：2015-02-19 05:19:53 【问题描述】：

让我们假设以下向量：

x = c( 0.5, 0.4, 0.8 )

其中 x[1] 和 x[2] 值是相关的，具有相关矩阵：

     x[1]  x[2]  x[3]
x[1]  1    0.8    0
x[2]  0.8  1      0
x[3]  0    0      1

我想计算 x 的平均值，但要考虑相关性。

我尝试使用 lm() 进行广义最小二乘，但这意味着要使用水平函数，而 lm() 不喜欢使用 poly(x,0)。我寻找使用用户定义的函数，但它应该返回要拟合的参数......

作为一个具体的例子，让我们从进化树中取出三个物种：

library(ape)
## The evolution tree
t=rtree(3)
## Plot it, you notice that two are closer to each other than the 3rd one
plot(t)
## Correlation matrix
vcv.phylo(t,corr=T)
      t1        t3 t2
t1 1.0000000 0.4019544  0
t3 0.4019544 1.0000000  0
t2 0.0000000 0.0000000  1

欢迎任何提示！

【问题讨论】：

我有点困惑；您是否建议向量x 的各个元素是相关的，即。 x[1] = 0.5 & x[2] = 0.4 是相关的）- 似乎不正确（相关性不会被定义）是的，例如，假设我想平均街道上人们的体型。我该如何对待兄弟？由于它们的共同父母，它们的大小高度相关。您的问题根本不清楚：您似乎不知道自己要计算哪个数量。您通过“我想计算 x 的平均值，但考虑到相关性”来准确定义什么？加权平均？是的，加权平均值。所以在没有相关性的情况下（0.5+0.4+0.8）/3。但是考虑到第 1 次和第 2 次测量值之间的相关性，它们的权重不应为 1。所以类似于 (0.5*0.5 + 0.4*0.5 + 0.8*1)/2 您所描述的现象正确地称为自相关。在 stats.stackexchange.com 上搜索类似问题可能会更好。问题可能不在于计算平均值，而在于从可疑自相关的变量中抽样。 【参考方案1】：

答案可以在 CERN 论文中找到：

ftp://ftp.desy.de/pub/preprints/cern/ppe/ppe94-185.ps.gz

该过程是广义最小二乘回归。

结果见公式 (2) 第 (1) 页。

【讨论】：

以上是关于如何计算相关值的平均值？的主要内容，如果未能解决你的问题，请参考以下文章