用R做logistic回归,定性自变量太多导致报错怎么办
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用R做logistic回归,定性自变量太多导致报错怎么办相关的知识,希望对你有一定的参考价值。
参考技术A用R做logistic回归,定性自变量太多导致报错的解决办法
先减少定性自变量个数,试一试。
如果仍报错,则可能是其它原因。
或者,同时辅助SPSS软件试一试。
fit1.cv=cv.glmnet(w.full[,1:18],w.full[,19],family="binomial") #交叉检验
coef1=coef(fit1,s=fit1.cv$lambda.min) #10折交叉检验惩罚系数最小时的系数
active.fit1=which(coef1 !=0)
active.coef1=coef1[active.fit1]
active.fit1 #显示此时剩余的自变量
active.coef1 #上述此时自变量的回归系数估计
做二元logistic回归遗漏项很多怎么办
参考技术A 可以多尝试不同的变量选择方法,比如glmnet,偏最小二乘,向前向后逐步变量选择,或者先做一步PCA,再用主成分进行logistic回归。最终看下哪个模型的效果好,就选用哪一个模型。1.可以用变量选取,如向前或向后法,然后利用Cross-Validatin或者AIC/BIC,Mallow Cp(若数据服从假设)方法挑出最好的。2.用Lasso或者Ridge Regression这样的Regularization方法调整参数选择模型。最后,可以用PCA先降维,然后再做回归。
以上是关于用R做logistic回归,定性自变量太多导致报错怎么办的主要内容,如果未能解决你的问题,请参考以下文章