scikit-learn 中的“fit”方法有啥作用? [关闭]

Posted

技术标签:

【中文标题】scikit-learn 中的“fit”方法有啥作用? [关闭]【英文标题】:What does the "fit" method in scikit-learn do? [closed]scikit-learn 中的“fit”方法有什么作用? [关闭] 【发布时间】:2018-01-24 01:06:00 【问题描述】:

您能否解释一下 scikit-learn 中的“fit”方法的作用?为什么有用?

【问题讨论】:

问题很广泛,但我会咬一口。许多模型在 scikit-learn 中都有拟合方法。当您调用 fit 方法时,它会估计数据点的最佳代表函数(可能是一条线、多项式或离散边界)。使用该表示,您可以计算新的数据点。以 linear_regression 为例:当您在点数据集上调用 fit 时,它会为您提供一个函数,该函数代表一条 最适合所有点的线。使用该线函数,您可以估计其他结果。我建议您阅读 linefitting 以便于理解。 嗨“umutto”非常感谢。你能给我提供阅读“线拟合”的链接吗? 当然,你可以用谷歌搜索线路拟合,或者linear regression,它应该会给你一个洞察力。更好的是,如果您想了解机器学习的直观介绍,我建议您关注 Andrew Ng 的 coursera。这对于机器学习的易于理解的开始非常有用。 Here is the line fitting, estimation 部分课程。 这是您可以轻松地通过谷歌搜索或在任何介绍数据科学教程中阅读的内容。 我认为这是一个很好的问题,只要你做一些事情来集中注意力。考虑将其重点放在使用特定用例的拟合上,如机器学习模型、预处理步骤等。 【参考方案1】:

简而言之拟合等于训练。然后,经过训练,模型就可以用来做预测了,通常是通过.predict()方法调用。

详细说明:将模型拟合到(即使用.fit() 方法)训练数据本质上是建模过程的训练部分。它找到通过所使用的算法指定的方程的系数(例如上面的umutto's 线性回归示例)。

然后,对于分类器,您可以使用predict 方法对传入的数据点(来自测试集或其他)进行分类。或者,在回归的情况下,当predict 用于传入数据点时,您的模型将进行插值/外推。

还应注意,有时“拟合”命名法用于非机器学习方法,例如缩放器和其他预处理步骤。在这种情况下,您只是将指定的函数“应用”到您的数据中,就像使用 min-max 缩放器、TF-IDF 或其他转换一样。

注意:这里有几个参考...

fit method in python sklearn http://scikit-learn.org/stable/tutorial/basic/tutorial.html

【讨论】:

不错的答案。但是当您编写程序时,您需要指定您将使用的模型类型,正确的(连同目标/损失函数)。例如,您指定将使用线性/二次/逻辑回归?

以上是关于scikit-learn 中的“fit”方法有啥作用? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

如何预测 scikit-learn 中的时间序列?

如何预测scikit-learn中的时间序列?

分类器中的 scikit-learn refit/partial fit 选项

keras/scikit-learn:使用 fit_generator() 进行交叉验证

sklearn.decomposition.DicitonaryLearning.fit 中的 y 参数有啥作用?

scikit-learn 中的线性回归