在R中,根据当前的统计值,如何知道原始数据并应用回归分析

Posted

技术标签:

【中文标题】在R中,根据当前的统计值,如何知道原始数据并应用回归分析【英文标题】:In R, according to current statistic values, how to know the raw data like and apply regression analysis 【发布时间】:2022-01-11 14:25:18 【问题描述】:

我有两个变量 x,y ,目前知道'mean value \sd value\ ssx\ssy':

    有什么方法可以知道实际的 x/y 特定值吗? 根据当前统计值,是否可以对y~x进行回归分析?

【问题讨论】:

除了@StupidWolf,您还可以使用回溯来找出这些指标的 x 和 y 的“可能”解决方案。然而,由于可以说有不止一种解决方案,您永远不会知道原始观察结果是什么,因此您无法进行线性回归。 【参考方案1】:

求解 $X$$Y$ 的原始值,给出平均值和标准偏差,你有两个方程和十六个未知数。代数告诉你有多种解决方案。问题 #1 的答案是

但是,即使您可以求解原始值,您也会丢失回归的关键信息:值是如何配对的。举个例子吧。

$$ X = (1, 2, 3, 4), Y = (1, 3, 2, 4)\\ \文本vs\\ X = (1, 2, 3, 4), Y = (4,1,3,2)\\ $$

两行具有相同的 $X$$Y$的汇总统计数据(平均值和标准差)跨度>。但是,回归方程会有所不同,因为值的配对是不同的。对于第一个数据集,配对将是 $((1, 1), (2, 3), (3, 2), (4, 4))$,而第二个给出 $((1, 4), (2,1), (3, 3), (4,2))$。。 p>

【讨论】:

以上是关于在R中,根据当前的统计值,如何知道原始数据并应用回归分析的主要内容,如果未能解决你的问题,请参考以下文章

如何从数据子集中随机抽取并在 R 中引导统计测试

根据其他三列中的值设置 R 列中的值

在 R 中,如何使用各种条件将数字列变为一个新列?

如何在R语言中使用Logistic回归模型

iOS-关于如何知道应用被杀死并做相应处理

如何在Shiny R中丢弃DT :: datatable上的用户编辑