我们是不是应该在输入 cox 模型(生存分析)之前对定量协变量进行归一化?

Posted

技术标签:

【中文标题】我们是不是应该在输入 cox 模型(生存分析)之前对定量协变量进行归一化?【英文标题】:Should we normalize a quantitative co-variable before inputing in a cox model (survival analysis)?我们是否应该在输入 cox 模型(生存分析)之前对定量协变量进行归一化? 【发布时间】:2022-01-09 21:30:20 【问题描述】:

我正在计算病例对照研究的生存分析。 结果是移植物丢失:是或否 - 有正确的审查

我的队列分为三个集群,我想看看这些集群是否存在生存差异(mydata$HCPC_clust - 分类变量:K1、K2、K3),而考虑(调整?)一个定量变量:进行病例诊断的移植后时间(P_t_J0_de_la_transplant_mois)。

我的代码是这个:

result = coxph(mydata.surv~ as.factor(mydata$HCPC_clust) + 
               mydata$P_t_J0_de_la_transplant_mois_)

关于比例性,我的模型似乎没问题(虽然我没有测试对数线性)

test.mydata <- cox.zph(result, transform=c("km"), global=TRUE )

                                        chisq df    p
as.factor(mydata$HCPC_clust)         0.5298  2 0.77
mydata$P_t_J0_de_la_transplant_mois_ 0.0178  1 0.89
GLOBAL                               0.7840  3 0.85

我的问题是:我应该在将定量协变量“P_t_J0_de_la_transplant_mois”输入到我的模型之前对其进行标准化/缩放吗?

目前,变量“P_t_J0_de_la_transplant_mois”并不是一个重要因素,而集群 2 和 3 的移植物丢失风险增加。

【问题讨论】:

【参考方案1】:

对连续定量协变量进行缩放或标准化不会影响模型的实质或该协变量的“重要性”。这会改变回归系数的点估计值,但也会相应地改变估计的标准误差。在这方面,Cox 回归与其他回归没有根本区别。

将预测器保持在当前的月单位比使用 R scale() 函数更容易理解。如果您通过减去均值并除以标准差来进行缩放,则您将获得预测变量的标准差单位。您如何看待标准差单位?您如何将这些单位应用于新数据?

但是,您假设 log-hazard 和该预测变量的值之间存在简单的线性关系。更灵活地对该预测器进行建模可能是明智的,例如使用受限三次样条。这可能会阐明该预测变量与结果之间更微妙的关联。

【讨论】:

以上是关于我们是不是应该在输入 cox 模型(生存分析)之前对定量协变量进行归一化?的主要内容,如果未能解决你的问题,请参考以下文章

生存分析(Survival Analysis)Cox风险比例回归模型(Cox proportional hazards model)及

生存分析(Survival Analysis)Cox风险比例回归模型(Cox proportional hazards model)及

R语言生存分析之COX比例风险模型构建及C-index计算示例

Cox回归+Cox比例风险回归模型

Cox回归模型生存分析

cox风险比例模型