Cox PH模型中协变量的系数值太大

Posted

技术标签:

【中文标题】Cox PH模型中协变量的系数值太大【英文标题】:Coefficient value of covariate in Cox PH model is too big 【发布时间】:2021-12-11 20:18:16 【问题描述】:

我正在尝试在 R 中开发具有时变协变量的 Cox PH 模型。我使用来自 survival 包的 coxph 函数。估计过程没有任何问题,虽然一个协变量的系数值太大,特别是2.5e+32。

我无法猜测这个问题的原因以及如何解决它。这个变量是非平稳的,违反了比例假设。这两个事实中的任何一个都可能导致系数值这么大吗?

【问题讨论】:

请提供足够的代码,以便其他人更好地理解或重现问题。 【参考方案1】:

更多信息可以帮助您解决问题。

无论如何,我怀疑不成比例是罪魁祸首。这意味着您有一些异常值严重偏向您的系数,超出了合理的预期。您可以通过绘制cox.zph 的输出来快速浏览一下。

另一种可能的解释是,这取决于您用于定义协变量的度量单位。系数的大小可以被有意义地解释吗?如果是这样,您可以简单地重新缩放/标准化/对数变换该协变量以获得“更易于管理”的系数(如果这在理论上是合适的)。

这也可能是由于所谓的“完全分离”,已在here 和here 讨论过。

【讨论】:

以上是关于Cox PH模型中协变量的系数值太大的主要内容,如果未能解决你的问题,请参考以下文章

C++ 克隆习语中协变返回类型的用处?

Python Sklearn 线性回归产生不正确的系数值

R语言构建回归模型诊断(正态性无效)进行变量变换使用car包中的powerTransform函数对目标变量进行Box-Cox变换(Box–Cox transform to normality)

我们是不是应该在输入 cox 模型(生存分析)之前对定量协变量进行归一化?

lasso和cox结果矛盾

R语言生存分析之COX比例风险模型构建及C-index计算示例