R coxph() 警告:Loglik 在变量之前收敛
Posted
技术标签:
【中文标题】R coxph() 警告:Loglik 在变量之前收敛【英文标题】:R coxph() warning: Loglik converged before variable 【发布时间】:2013-10-22 13:18:29 【问题描述】:我在使用 coxph() 时遇到了一些问题。 我有两个分类变量:Sex 和 Probable Cause,我想将它们用作预测变量。性别只是典型的男性/女性,但可能的原因有 5 个选项。 我不知道警告消息有什么问题。为什么置信区间从 0 到 Inf 且 p 值如此之高?
这是代码和输出:
> my_coxph <- coxph(Surv(tempo,status) ~ factor(Sexo)+ factor(Causa.provavel) , data=ceabn)
Warning message:
In fitter(X, Y, strats, offset, init, control, weights = weights, :
Loglik converged before variable 2,3,5,6 ; beta may be infinite.
> summary(my_coxph)
Call:
coxph(formula = Surv(tempo, status) ~ factor(Sexo) + factor(Causa.provavel),
data = ceabn)
n= 43, number of events= 31
coef exp(coef) se(coef) z Pr(>|z|)
factor(Sexo)macho 7.254e-01 2.066e+00 4.873e-01 1.488 0.137
factor(Causa.provavel)caca 2.186e+01 3.107e+09 9.698e+03 0.002 0.998
factor(Causa.provavel)colisao linha MT 1.973e+01 3.703e+08 9.698e+03 0.002 0.998
factor(Causa.provavel)indeterminado 9.407e-01 2.562e+00 1.683e+04 0.000 1.000
factor(Causa.provavel)predacao 2.170e+01 2.655e+09 9.698e+03 0.002 0.998
factor(Causa.provavel)predado 2.276e+01 7.659e+09 9.698e+03 0.002 0.998
exp(coef) exp(-coef) lower .95 upper .95
factor(Sexo)macho 2.065e+00 4.841e-01 0.7947 5.368
factor(Causa.provavel)caca 3.107e+09 3.219e-10 0.0000 Inf
factor(Causa.provavel)colisao linha MT 3.703e+08 2.701e-09 0.0000 Inf
factor(Causa.provavel)indeterminado 2.562e+00 3.904e-01 0.0000 Inf
factor(Causa.provavel)predacao 2.655e+09 3.766e-10 0.0000 Inf
factor(Causa.provavel)predado 7.659e+09 1.306e-10 0.0000 Inf
Concordance= 0.752 (se = 0.059 )
Rsquare= 0.608 (max possible= 0.987 )
Likelihood ratio test= 40.23 on 6 df, p=4.105e-07
Wald test = 7.46 on 6 df, p=0.2807
Score (logrank) test = 30.48 on 6 df, p=3.183e-05
谢谢
【问题讨论】:
【参考方案1】:几年前,当我向 Terry Therneau(pkg:survival 的作者)询问这件事时,他说被触发以生成该警告的测试过于敏感。通常警告是不正确的。您通常可以只看一下您的系数,看看它们不是无限的,甚至实际上是无限的,在大多数情况下,20 的系数会不切实际地大,但小于 5 的系数则不会。
但是,在您的情况下,它似乎正确地警告您数据可能存在问题,因为您的系数大得难以置信。指数模型中 2.276e+01 (= 22.7) 的 beta 系数高得离谱。估计的相对风险超过一百万!您应该查看数据的表格分类,以解决完全分离的问题。你的对照组有没有人死了,呃,有事件吗?
【讨论】:
我在 43 个事件中有 31 个事件。但我认为你是对的,我搞砸了数据。 Terry Therneau(pkg:survival 的作者)的答案链接:stat.ethz.ch/pipermail/r-help/2008-September/174201.html 我想这有点晚了,但以防万一它对某人有帮助:我在比较多个组时遇到了这个问题,其中一个没有事件。 这是我在 7 年前向原始发帖人提出的问题。此类问题最好通过表格显示来解决:table(outcome, treatment_variable, selected_categorical_covariates)
以上是关于R coxph() 警告:Loglik 在变量之前收敛的主要内容,如果未能解决你的问题,请参考以下文章
R语言使用survival包的coxph函数在竞争风险分析的加权数据集上进行回归模型构建使用coxph函数对加权数据集进行竞争风险模型拟合
拟合的 coxph 模型随时间变化的地层和集群的公式中的项排序而变化
R语言使用coxph函数构建生存分析回归模型,使用forestmodel包的forest_model函数可视化生存回归模型对应的森林图
R语言使用coxph函数构建生存分析回归模型,使用forestmodel包的forest_model函数可视化生存回归模型对应的森林图