sklearn中正则化的Lasso问题

Posted xtxdm

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sklearn中正则化的Lasso问题相关的知识,希望对你有一定的参考价值。

Lasso,也就是L1正则项,它倾向于完全消除最不重要特征的权重(置为0),就是说Lasso会自动执行特征选择,并输出一个稀疏模型。

问题:Lasso在特征数量超过训练实例的数量时(比如10条数据20个特征),或者特征之间相关性比较强,Lasso就会很不稳定。

总结:Lasso可进行特征选择,不代表不需要人为进行筛选,需要去掉相关性较强的特征。

以上是关于sklearn中正则化的Lasso问题的主要内容,如果未能解决你的问题,请参考以下文章

正则化项L1和L2的直观理解及L1不可导处理

在 sklearn 中访问从 ElasticNetCV 获得的正则化路径

机器学习中正则化项L1和L2的直观理解

数据预处理中归一化(Normalization)与损失函数中正则化(Regularization)解惑

L1正则化和L2正则化

手写算法-python代码实现Lasso回归