使用一个解释变量创建完整与简化模型

Posted

技术标签:

【中文标题】使用一个解释变量创建完整与简化模型【英文标题】:Creating a full vs. reduced model with one explanatory variable 【发布时间】:2022-01-11 21:07:21 【问题描述】:

我正在尝试创建一个只有一个解释变量的 Cox 比例风险模型。要执行似然比检验,我知道我需要一个完整的简化模型。我也知道完整模型将是每个组的单独平均值,而简化模型将使用整个数据集的整体平均值。如何确保在 R 中正确设置?在该模型中,如果患者进行了心脏手术,z 为 1,否则 z 为 0

我有:

model<-coxph(Surv(time,delta)~z,method='breslow',data=heartdata)

X.lr <- 2*(model$loglik[2]-model$loglik[1])

这能实现吗?我得到了一个答案,我只是想知道这是否是一个完整的模型和简化的模型,因为我没有其他变量可以使用?

【问题讨论】:

【参考方案1】:

在这种情况下,这确实有效,但我认为使用update()anova() 有更好/更透明的解决方案(我什至不知道coxph 模型的对数似然组件包括完整和零偏差)。

使用来自survival 包的内置数据集:

## drop NAs so we are using the same data set for full & reduced models
lungna <- na.omit(lung)
## fit full model
m1 <- coxph(Surv(time, status) ~ ph.ecog, data=lungna)
## update model to fit intercept only (` ~ 1 ` replaces the RHS of the formula):
## ~ 1 means "intercept only" in R formula notation
m0 <- update(m1, . ~ 1)
## anova() runs a likelihood-ratio test
anova(m0,m1)

结果:

Analysis of Deviance Table
 Cox model: response is  Surv(time, status)
 Model 1: ~ 1
 Model 2: ~ ph.ecog
   loglik  Chisq Df P(>|Chi|)    
1 -508.12                        
2 -501.91 12.409  1 0.0004273 ***

您可以确认 2*diff(m1$loglik) 给出 12.409,与 anova() 报告的偏差(“Chisq”)差异值相同,并且 pchisq(chisq_val, df = 1, lower.tail = FALSE) 给出报告的 p 值。

【讨论】:

以上是关于使用一个解释变量创建完整与简化模型的主要内容,如果未能解决你的问题,请参考以下文章

对y取对数后回归模型如何解释

spss中广义线性模型解释率比较

预测模型还是解释模型。两者区别及联系

负二项式回归:系数解释

线性回归模型中设置随机误差项有何意义?对其都有哪些假设?

什么样的模型是线性回归