岭回归可以用于分类因变量吗?
Posted
技术标签:
【中文标题】岭回归可以用于分类因变量吗?【英文标题】:Can ridge regression be used on categorical dependent variable? 【发布时间】:2022-01-15 16:22:22 【问题描述】:我正在尝试将岭回归应用于电信流失数据,其中因变量流失是分类变量,30 个中只有 3 个连续预测变量,其中存在一定程度的多重共线性。我可以使用岭回归吗?
【问题讨论】:
【参考方案1】:看来您正在寻找多项式岭回归:
简短的回答是肯定的!
请参阅此处以获取更多说明: https://stats.stackexchange.com/questions/104779/why-does-ridge-regression-work-well-in-the-presence-of-multicollinearity
并考虑一下 Peter Flom 关于精确共线性的建议。
参见此处:Multinomial ridge regression using glmnet gives results with probabilities above one and negative for different target classes, any idea why? 示例。
【讨论】:
【参考方案2】:由于您的任务是将客户分类为Churn
或Non-Churn
,因此这是一个分类任务而不是回归任务。
岭回归仅用于回归目的,因为它需要因变量是连续的。
所以对于您的分析,岭回归不能使用。
岭回归的特点是它在存在多重共线性但具有连续因变量的情况下工作正常。
你可以参考这个https://en.wikipedia.org/wiki/Ridge_regression
【讨论】:
以上是关于岭回归可以用于分类因变量吗?的主要内容,如果未能解决你的问题,请参考以下文章
H2O 不应该标准化正则化 GLM 模型(套索、岭、弹性网)的分类预测变量吗?
R语言glmnet拟合岭回归模型实战:岭回归模型的模型系数(ridge regression coefficients)及可视化岭回归模型分类评估计算(混淆矩阵accuracyDeviance)