r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

Posted 拓端数据部落

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现相关的知识,希望对你有一定的参考价值。

原文:http://tecdat.cn/?p=3795

 

介绍

Glmnet是一个通过惩罚最大似然来拟合广义线性模型的包。正则化路径是针对正则化参数λ的值网格处的套索或弹性网络罚值计算的。该算法速度极快,可以利用输入矩阵中的稀疏性x。它符合线性,逻辑和多项式,泊松和Cox回归模型。可以从拟合模型中做出各种预测。它也可以适合多响应线性回归。

glmnet算法采用循环坐标下降法,它连续优化每个参数上的目标函数并与其他参数固定,并反复循环直至收敛。该软件包还利用强大的规则来有效地限制活动集。由于高效的更新和技术,如热启动和主动集合收敛,我们的算法可以非常快地计算解决方案路径。

该代码可以处理稀疏的输入矩阵格式,以及系数的范围约束。其核心glmnet是一组Fortran子程序,它们使执行速度非常快。

该软件包还包括用于预测和绘图的方法以及执行K倍交叉验证的功能。

首先,我们加载glmnet包:


library(glmnet)

包中使用的默认模型是高斯线性模型或“最小二乘”,我们将在本节中演示。我们加载一组预先创建的数据用于说明。用户可以加载自己的数据,也可以使用保存在工作区中的数据。



load("QuickStartExample.RData")


该命令从该保存的R数据档案中加载输入矩阵x和响应向量y。


我们使用最基本模型glmnet。


fit=glmnet(x,y)


“适合”是类的一个对象,glmnet它包含拟合模型的所有相关信息以供进一步使用。我们不鼓励用户直接提取组件。相反,提供对象,如各种方法plot,print,coef和predict,使我们能够更优雅执行这些任务。



我们可以通过执行plot函数来显示系数:

MSE 测试集 

r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

我们看到lasso(alpha=1)在这里做的最好。我们也看到,使用的lambda的范围与alpha不同。


系数上限和下限

这些是最近添加的增强模型范围的功能。假设我们想要拟合我们的模型,但将系数限制为大于-0.7且小于0.5。这是很容易通过实现upper.limits和lower.limits参数:

r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现


惩罚因素

该参数允许用户对每个系数应用单独的惩罚因子。其每个参数的默认值为1,但可以指定其他值。特别是,任何penalty.factor等于零的变量都不会受到惩罚!让[ 数学处理错误]vĴ表示[ 数学处理错误]的惩罚因子Ĵ变量。罚款期限变为[ 数学处理错误] 请注意,惩罚因子在内部重新调整为与nvars相加。

当人们对变量有先验知识或偏好时,这非常有用。在很多情况下,一些变量可能非常重要,以至于一直想要保持这些变量,这可以通过将相应的惩罚因子设置为0来实现:

r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

 

点击标题查阅往期内容












更多内容,请点击左下角“阅读原文”查看

r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现


案例精选、技术干货 第一时间与您分享

长按二维码加关注

更多内容,请点击左下角“阅读原文”查看


以上是关于r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现的主要内容,如果未能解决你的问题,请参考以下文章

R语言-岭回归及lasso算法

Ridge和Lasso回归

Ridge和Lasso回归

岭回归和lasso回归的r语言代码

R语言glmnet拟合岭回归模型实战:岭回归模型的模型系数(ridge regression coefficients)及可视化岭回归模型分类评估计算(混淆矩阵accuracyDeviance)

R语言之岭回归