如何预测机器学习的基于计算的数据?
Posted
技术标签:
【中文标题】如何预测机器学习的基于计算的数据?【英文标题】:How to predict calculation based data for Machine Learning? 【发布时间】:2017-08-04 10:36:55 【问题描述】:我有大量的样本数据如下:
价格取决于从 Val_1 到 Val_14 的值(总共 150 个特征)。我想将此表用作机器学习的学习数据集。 现在我真正想要实现的是根据这些样本数据预测价格。这些值可以改变,预测价格应该根据这些计算而变化。
我没有任何具体的价格计算公式,所以我想将这些数据集用作机器学习中数据分类器的学习数据。
我已经尝试使用 Theano 和 Python 实现基于 Deeplearning 的各种算法,但到目前为止,我只成功地预测了具有预定义输出类的输出。有没有使用机器学习算法来预测这些计算的方法?
【问题讨论】:
你想要的是回归,而不是分类。 我正在使用线性回归,但结果不可接受。 【参考方案1】:我不确定深度学习是否是这种情况下的最佳方法 - 您的特征集非常有限,只能预测单个值。我有一种感觉,即使是简单的回归也会给你可接受的值。
我的建议是您尝试使用H2O 提供的不同模型。除了内置许多模型类型外,它还将绘制各种指标,以帮助您选择最适合您的情况的模型。根据我的经验,几乎总是 GBM 能提供最好的结果。
当你找到你要找的东西时,你可以导出模型并直接在java中使用它。或者,大多数模型类型在 python 的 sklearn
中具有等价物。
【讨论】:
感谢您的建议。我一定会调查的。我也编辑了我原来的问题。总共有 150 个功能可以计算价格。【参考方案2】:您可以使用大量的回归算法。检查来自 python 的sklearn doc 并阅读模型以及最适合您的特定情况的模型。
线性模型是一种非常简单的模型,但在处理混乱的数据时非常敏感。
我建议你试试 SVM 的 SVR。
【讨论】:
以上是关于如何预测机器学习的基于计算的数据?的主要内容,如果未能解决你的问题,请参考以下文章