Sklearn线性回归拟合输入顺序?外生变量先行吗?

Posted

技术标签:

【中文标题】Sklearn线性回归拟合输入顺序?外生变量先行吗?【英文标题】:Sklearn Linear Regression fit input order? Does exogenous variable go first? 【发布时间】:2019-11-10 12:27:55 【问题描述】:

参考页说:

Parameters: 
X : array-like or sparse matrix, shape (n_samples, n_features)
Training data

y : array_like, shape (n_samples, n_targets)
Target values. Will be cast to X’s dtype if necessary

X 是外生变量吗?我会假设是这样,但是对于 statsmodel OLS,内生是第一位的,所以我想确认一下,因为它们会产生不同的系数。

【问题讨论】:

【参考方案1】:

是的,您是正确的,与 statsmodel OLS 模块相比,您输入外生和内生变量的顺序在 sklearn 模块中是相反的(对于 sklearn 中的其他模型也是如此)。

如果 X = 外生变量且 Y = 内生变量

在 sklearn 中你会做这样的事情:

clf.fit(X,Y)

而在 statsmodel 中你会这样做:

clf.fit(Y,X)

clf 是您要构建的模型。

希望这会有所帮助!

【讨论】:

确实如此!感谢您的确认:) 如果您能接受它作为答案或支持它,我将不胜感激。提前谢谢? 对不起,我试图投票,但我太新了,我还不允许:) 只是验证了答案 非常感谢 SpartanDawg。

以上是关于Sklearn线性回归拟合输入顺序?外生变量先行吗?的主要内容,如果未能解决你的问题,请参考以下文章

带有sklearn的numpy多项式线性回归

Sklearn拟合线性回归[关闭]

Sklearn拟合线性回归[关闭]

Python:仅使用 1 个外生变量执行数百万次简单线性回归的最快方法

线性回归

Python数模笔记-Sklearn线性回归