机器学习——XGboost算法

Posted qianchaomoon

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习——XGboost算法相关的知识,希望对你有一定的参考价值。

XGboost算法

  XGBoost是GBDT算法的一种改进,是一种常用的有监督集成学习算法;是一种伸缩性强、便捷的可并行构建模型的GradientBoosting算法。

  原理是在GBDT目标函数的基础上加入惩罚项,如下图绿框。通过限制树模型的叶子节点的个数和叶子节点的值来降低模型复杂度,从而防止过拟合,二分之一是为了求导方便。t是树的棵数,obj为损失函数

  大体步骤:防止过拟合,二阶泰勒展开公式计算,给出了新的树的划分标准,用的是损失函数的增量。

  

  目的:找到第t颗树是如何搭建的

所以我们的期望是损失函数只和第t颗树有关系  

技术图片

 技术图片

 技术图片

 

 技术图片

 

 技术图片

 

 技术图片

  XGBoost官网:http://xgboost.readthedocs.io;

  XGBoost支持开发语言:Python、R、Java、Scala、C++等。

安装方式一:编译Github上的源码,参考http://xgboost.readthedocs.io/en/latest/build.html
安装方式二:python的whl文件进行安装,要求python版本3.5或者3.6;下载链接:https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost;安装参考命令:pipinstallf:///xgboost-0.7-cp36-cp36m-win_amd64.whl
安装方式三:直接pip命令安装:pip install xgboost 

以上是关于机器学习——XGboost算法的主要内容,如果未能解决你的问题,请参考以下文章

机器学习集成学习进阶Xgboost算法案例分析

机器学习:集成算法 - xgboost

机器学习——XGboost算法

机器学习集成学习进阶Xgboost算法原理

机器学习集成学习(Boosting)——XGBoost算法(理论+图解+公式推导)

# 机器学习算法总结-第九天(XGboost)