如何解释在步骤 2 中 IV 不显着但仍显示显着 F 的分层回归输出

Posted

技术标签:

【中文标题】如何解释在步骤 2 中 IV 不显着但仍显示显着 F 的分层回归输出【英文标题】:How to interpret hierarchical regression output that has insignificant IV in step 2, but still shows significant F 【发布时间】:2022-01-20 13:23:12 【问题描述】:

我正在进行 4 步分层回归,其中第一步是添加分组变量(学生地位、性别和以前的经验),第二步是添加心理维度(与心理变量相关的李克特量表) .

在回归的第二步,总输出/f 检验表明该模型是显着的,但该步骤的实际添加(即 psych 变量)不是(输出见下文)。如果人们能够,我希望在理解这一点方面得到一些帮助,我很难过!

> summary(reg1)

Call:
lm(formula = IASMHS80 ~ Gender + Class + PreviousCounseling, 
    data = mydatareg)

Residuals:
     Min       1Q   Median       3Q      Max 
-1.22725 -0.32881 -0.06004  0.31482  1.39994 

Coefficients:
                    Estimate Std. Error t value Pr(>|t|)    
(Intercept)         2.631108   0.175667  14.978  < 2e-16 ***

Gender             -0.017129   0.061949  -0.277 0.782444  
Class              -0.001098   0.018251  -0.060 0.952099    
PreviousCounseling -0.255314   0.071774  -3.557 0.000468 ***

---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.441 on 200 degrees of freedom
Multiple R-squared:  0.06208,   Adjusted R-squared:  0.04801 
F-statistic: 4.413 on 3 and 200 DF,  p-value: 0.004971

> summary(reg2)

Call:
lm(formula = IASMHS80 ~ Gender + Class + PreviousCounseling + 
    IM480, data = mydatareg)

Residuals:
    Min      1Q  Median      3Q     Max 
-1.2229 -0.3121 -0.0627  0.2961  1.4703 

Coefficients:
                    Estimate Std. Error t value Pr(>|t|)    
(Intercept)         2.819675   0.231152  12.198  < 2e-16 ***

Gender             -0.024626   0.062149  -0.396 0.692358   
Class              -0.001788   0.018234  -0.098 0.921988    
PreviousCounseling -0.254564   0.071675  -3.552 0.000478 ***

IM480              -0.037251   0.029738  -1.253 0.211797    

---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.4404 on 199 degrees of freedom
Multiple R-squared:  0.06942,   Adjusted R-squared:  0.05072 
F-statistic: 3.711 on 4 and 199 DF,  p-value: 0.006151   

【问题讨论】:

【参考方案1】:

你的R2也很低。假设这是调查数据,这意味着考虑到他们报告的性别、班级和以前的咨询,受访者的 IASMHS80 没有得到很好的解释。鉴于您的 p

就其外观而言,残差均匀分布在拟合线周围,但在大多数情况下,它们不在拟合线上。鉴于该回归的系数,您可以看到之前的咨询是最均匀分散的。而受访者报告的性别和班级分布较不均匀。

话虽如此,我很好奇这些数据在多大程度上符合多元线性回归的假设。残差的描述性统计表明存在正态分布的可能性(以及样本量)。方差如何(同质性或同方差性)?独立性如何?多重共线性?异常值?

在随后的回归中,当您添加任何 IM480 代表时,结果非常相似。您可以看到,这些变量并不能很好地解释 IASMHS80 是什么。但是,它确实表明数据始终不能解释这一结果。

您的决定系数 (R2) 从 0.04801 变为 0.05072,变化幅度约为 0.02%。这意味着 IM480 对结果的解释额外增加了 0.02%。

【讨论】:

以上是关于如何解释在步骤 2 中 IV 不显着但仍显示显着 F 的分层回归输出的主要内容,如果未能解决你的问题,请参考以下文章

使用 p 值逐步回归以删除 p 值不显着的变量

如何证明 NDCG 分数是显着的

如何在 R 中执行测试的现场显着性

如何在 R 图中显示显着的 p 值

如何计算 R 中两个数据集的显着差异?

ggpubr:在标签中显示显着性水平(*** 或 n.s.)而不是 p 值