使用 python 将 xgboost 模型保存到 hdfs

Posted

技术标签:

【中文标题】使用 python 将 xgboost 模型保存到 hdfs【英文标题】:Saving xgboost model to hdfs using python 【发布时间】:2018-11-09 12:33:24 【问题描述】:

我需要使用 python 将 XGBoost 模型保存到 hdfs。我尝试过使用xgbm.save_model(path_to_hdfs) 但我收到以下错误:src/io.cc:37: Please compile with DMLC_USE_HDFS=1 to use hdfs

所以我的问题是如何处理这个错误?或者也许还有其他方法可以使用 python 脚本将 XGBoost 模型存储到 hdfs?

【问题讨论】:

【参考方案1】:

正如错误所说,您需要在支持 HDFS 的情况下编译 xgboost。

为此,您需要执行以下操作:

git clone --recursive https://github.com/dmlc/xgboost.git
cd xgboost
mkdir build
cmake -DDMLC_USE_HDFS=1 ..
make

安装Python package再试一次。

【讨论】:

以上是关于使用 python 将 xgboost 模型保存到 hdfs的主要内容,如果未能解决你的问题,请参考以下文章

如何保存和加载 xgboost 模型? [关闭]

如何从 xgboost 中的最佳迭代中保存模型?

是否可以在 Python 中训练 xgboost 模型并将其部署在 C/C++ 中运行?

将 PMML 模型导入 Python (Scikit-learn)

R语言构建xgboost模型:使用xgb.DMatrix保存加载数据集使用getinfo函数抽取xgb.DMatrix结构中的数据

机器学习之路: python 实践 提升树 XGBoost 分类器