如何在 python 中拟合数据集？ - lr.fit(x_train, y_train) 给我错误

Posted 2023-03-12

技术标签:

【中文标题】如何在 python 中拟合数据集？ - lr.fit(x_train, y_train) 给我错误【英文标题】：How do I go about fitting a dataset in python? - lr.fit(x_train, y_train) giving me errors 【发布时间】：2021-05-24 07:58:18 【问题描述】：

这是我的代码：

blood_df=pd.read_csv('blood_donation.csv')
x,y=blood_df.iloc[:,:-1], blood_df['Donated2020']
blood_df['Gender'].value_counts()

x_dummies = pd.get_dummies(x)
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x_dummies,y,random_state=0)

然后，当我尝试使用下面的 lr.fit 时，我开始收到错误。

from sklearn.linear_model import LinearRegression
lr = LinearRegression()
lr.fit(x_train, y_train)

这是错误的屏幕截图，因为它太严重了： error screengrab

【问题讨论】：

Input contains NaN 看起来 LinearRegression 不喜欢 nan 值。您需要估算那些 NaN 值或删除它们。请重新阅读 How to ask，因为您第一次阅读时似乎错过了一些关键点，即“DO NOT发布代码、数据、错误消息等的图像。 - 将文本复制或输入到问题中”（强调原文）。 【参考方案1】：

按照 Quang Hoang 在 cmets 中的建议，添加此方法有效：

#imputing missing values with their mean
blood_df=blood_df.fillna(blood_df.mean())

【讨论】：

以上是关于如何在 python 中拟合数据集？ - lr.fit(x_train, y_train) 给我错误的主要内容，如果未能解决你的问题，请参考以下文章