如何在 Azure 机器学习中使用历史数据集进行训练和预期数据集作为预测的输入

Posted

技术标签:

【中文标题】如何在 Azure 机器学习中使用历史数据集进行训练和预期数据集作为预测的输入【英文标题】:How to use historical data set for training and prospective data set as input for prediction in Azure Machine Learning 【发布时间】:2018-10-16 01:24:49 【问题描述】:

背景资料: 我做了一个数据挖掘实验,我使用客户购买的历史数据作为我的挖掘结构的案例表。第二个数据集(潜在买家)用于测试。

现在我想在 Azure 机器学习 (Studio) 中实现相同的场景。但是,我无法弄清楚如何使用一个数据集用于训练和另一个数据集用于测试。

此外,我想问一下是否可以使用数据集来训练模型,但在将模型部署到 Web 服务之后,将输入字段限制为某些列?

历史数据集包含我想用于训练模型的 12 列。但是,在通过部署的模型进行测试时,我只需要其中的 9 个列作为输入。

我希望我说清楚了,一切都是可以理解的。如果没有,请随时问我。

亲切的问候, lja

【问题讨论】:

【参考方案1】:

但是,我无法弄清楚如何使用一个数据集进行训练,而使用不同的数据集进行测试。

你可以这样做:

请注意两个数据集应该有相同的列!

历史数据集包含我想用于训练模型的 12 列。但是,在通过部署的模型进行测试时,我希望只需要其中的 9 个列作为输入。

模型(以及生成的 Web 服务)需要您训练时使用的列来为模型提供数据。如果不需要其他 3 列,则将其留空。

如果您有自己的应用程序使用 Web 服务,您只需询问所需的输入字段,然后在后台发送空值。

【讨论】:

感谢您的回答。您是否熟悉 SSAS 中的数据挖掘? @lja 不,我以前从未使用过。

以上是关于如何在 Azure 机器学习中使用历史数据集进行训练和预期数据集作为预测的输入的主要内容,如果未能解决你的问题,请参考以下文章

Azure 机器学习工作室将行追加到数据集

如何使用机器学习从给定的地理数据集在 python 中进行预测?

ML.NET机器学习API容器化与Azure DevOps实践:RESTful API

交叉验证

机器学习100天:005 数据预处理之划分训练集

机器学习100天:005 数据预处理之划分训练集