在 SQL 数据库上训练决策树分类器
Posted
技术标签:
【中文标题】在 SQL 数据库上训练决策树分类器【英文标题】:Training a decision tree classifier on SQL database 【发布时间】:2021-04-09 18:29:30 【问题描述】:我有一个 SQL 数据库,它有超过 100 万行,我想在上面训练一个决策树分类器
有什么方法可以直接训练 SQL 数据而不需要将其转换为 DataFrame 或将其转换为 DataFrame 是必要的
【问题讨论】:
【参考方案1】:显然,如果您要求的话,您可以在 SQL 中运行 python 和 R 脚本。这里有更多文档:
https://docs.microsoft.com/en-us/sql/machine-learning/sql-server-machine-learning-services?view=sql-server-ver15.
块引用 在 SQL Server 中执行 Python 和 R 脚本 SQL Server 机器学习服务允许您在数据库中执行 Python 和 R 脚本。您可以使用它来准备和清理数据、进行特征工程,以及在数据库中训练、评估和部署机器学习模型。该功能在数据所在的位置运行您的脚本,并消除了通过网络将数据传输到另一台服务器的过程。
您可以使用存储过程 sp_execute_external_script 在 SQL Server 实例上执行 Python 和 R 脚本。
Python 和 R 的基本发行版包含在机器学习服务中。除了 Microsoft 软件包之外,您还可以安装和使用开源软件包和框架,例如 PyTorch、TensorFlow 和 scikit-learn。
【讨论】:
以上是关于在 SQL 数据库上训练决策树分类器的主要内容,如果未能解决你的问题,请参考以下文章
朴素贝叶斯分类器,决策树,boosting,随机森林实现分类