R语言实战应用-lightgbm 算法优化:不平衡二分类问题(附代码)
Posted 文宇肃然
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言实战应用-lightgbm 算法优化:不平衡二分类问题(附代码)相关的知识,希望对你有一定的参考价值。
前言
本案例使用的数据为kaggle中“Santander Customer Satisfaction”比赛的数据。此案例为不平衡二分类问题,目标为最大化auc值(ROC曲线下方面积)。目前此比赛已经结束。
以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!
竞赛题目链接为:
https://www.kaggle.com/c/santander-customer-satisfaction
2.建模思路
本文档采用微软开源的lightgbm算法进行分类,运行速度极快。具体步骤为:
-
读取数据;
-
并行运算:由于lightgbm包可以通过设置相应参数进行并行运算,因此不再调用doParallel与foreach包进行并行运算;
-
特征选择:
以上是关于R语言实战应用-lightgbm 算法优化:不平衡二分类问题(附代码)的主要内容,如果未能解决你的问题,请参考以下文章