使用线性回归模型预测单个值时出错

Posted

技术标签:

【中文标题】使用线性回归模型预测单个值时出错【英文标题】:Error while predicting a single value using a linear regression model 【发布时间】:2019-11-26 21:15:16 【问题描述】:

我是一个初学者,正在制作线性回归模型,当我根据测试集进行预测时,它运行良好。但是当我试图预测某个特定值的东西时。它给出了一个错误。我正在看的教程,他们没有任何错误。

dataset = pd.read_csv('Position_Salaries.csv')
X = dataset.iloc[:, 1:2].values
y = dataset.iloc[:, 2].values

# Fitting Linear Regression to the dataset
from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(X, y)

# Visualising the Linear Regression results
plt.scatter(X, y, color = 'red')
plt.plot(X, lin_reg.predict(X), color = 'blue')
plt.title('Truth or Bluff (Linear Regression)')
plt.xlabel('Position level')
plt.ylabel('Salary')
plt.show()

# Predicting a new result with Linear Regression
lin_reg.predict(6.5)

ValueError: 预期的二维数组,得到的是标量数组: 数组=6.5。 如果您的数据具有单个特征,则使用 array.reshape(-1, 1) 重塑您的数据,如果数据包含单个样本,则使用 array.reshape(1, -1)。

【问题讨论】:

@umopapisdn 是的,它说,“预期的二维数组,而不是一维数组”。 【参考方案1】:

根据Scikit-learn documentation,输入数组的形状应为(n_samples, n_features)。因此,如果您想要一个具有单个值的示例,您应该期望输入的形状为 (1,1)

这可以通过以下方式完成:

import numpy as np
test_X = np.array(6.5).reshape(-1, 1)
lin_reg.predict(test_X)

您可以通过以下方式检查形状:

test_X.shape

这样做的原因是因为输入可以有很多样本(即您想一次预测多个数据点),或者/并且每个样本可以有很多特征。

注意:Numpy 是一个支持大型数组和矩阵的 Python 库。 When scikit-learn is installed, Numpy should be installed as well.

【讨论】:

这有帮助吗?您还需要什么其他参考资料?

以上是关于使用线性回归模型预测单个值时出错的主要内容,如果未能解决你的问题,请参考以下文章

机器学习笔记

机器学习笔记

机器学习笔记

机器学习笔记

R语言广义线性模型函数GLMglm函数构建逻辑回归模型(Logistic regression)构建仿真数据集控制所有其它预测变量进而评估单个预测因子对结果概率的影响

有监督学习——线性回归