R语言实战应用-lightgbm 算法优化:不平衡二分类问题(附代码)

Posted 文宇肃然

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言实战应用-lightgbm 算法优化:不平衡二分类问题(附代码)相关的知识,希望对你有一定的参考价值。

前言

本案例使用的数据为kaggle中“Santander Customer Satisfaction”比赛的数据。此案例为不平衡二分类问题,目标为最大化auc值(ROC曲线下方面积)。目前此比赛已经结束。

以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!

MATLAB-30天带你从入门到精通

MATLAB深入理解高级教程(附源码)

tableau可视化数据分析高级教程

竞赛题目链接为:

https://www.kaggle.com/c/santander-customer-satisfaction 

2.建模思路

本文档采用微软开源的lightgbm算法进行分类,运行速度极快。具体步骤为:

  • 读取数据;

  • 并行运算:由于lightgbm包可以通过设置相应参数进行并行运算,因此不再调用doParallel与foreach包进行并行运算;

  • 特征选择:

以上是关于R语言实战应用-lightgbm 算法优化:不平衡二分类问题(附代码)的主要内容,如果未能解决你的问题,请参考以下文章

R语言中样本平衡的几种方法

机器学习:LightGBM算法原理(附案例实战)

LightGBM的并行优化

LightGBM算法---介绍说明python代码

机器学习 视频教程 数据挖掘 实战 开发 应用 算法 案例 R语言

R语言应用实战-基于R的C4.5算法和C5.0算法原理解析及应用案例