在 SQL 数据库上训练决策树分类器

Posted

技术标签:

【中文标题】在 SQL 数据库上训练决策树分类器【英文标题】:Training a decision tree classifier on SQL database 【发布时间】:2021-04-09 18:29:30 【问题描述】:

我有一个 SQL 数据库,它有超过 100 万行,我想在上面训练一个决策树分类器

有什么方法可以直接训练 SQL 数据而不需要将其转换为 DataFrame 或将其转换为 DataFrame 是必要的

【问题讨论】:

【参考方案1】:

显然,如果您要求的话,您可以在 SQL 中运行 python 和 R 脚本。这里有更多文档:

https://docs.microsoft.com/en-us/sql/machine-learning/sql-server-machine-learning-services?view=sql-server-ver15.

块引用 在 SQL Server 中执行 Python 和 R 脚本 SQL Server 机器学习服务允许您在数据库中执行 Python 和 R 脚本。您可以使用它来准备和清理数据、进行特征工程,以及在数据库中训练、评估和部署机器学习模型。该功能在数据所在的位置运行您的脚本,并消除了通过网络将数据传输到另一台服务器的过程。

您可以使用存储过程 sp_execute_external_script 在 SQL Server 实例上执行 Python 和 R 脚本。

Python 和 R 的基本发行版包含在机器学习服务中。除了 Microsoft 软件包之外,您还可以安装和使用开源软件包和框架,例如 PyTorch、TensorFlow 和 scikit-learn。

【讨论】:

以上是关于在 SQL 数据库上训练决策树分类器的主要内容,如果未能解决你的问题,请参考以下文章

准确率和预测分类器

分类算法——决策树

GBDT 梯度提升决策树简述

朴素贝叶斯分类器,决策树,boosting,随机森林实现分类

将决策树训练分类器的模型输出保存为 Spark Scala 平台中的文本文件

决策树