如何使用 sklearn 找到标准化残差?
Posted
技术标签:
【中文标题】如何使用 sklearn 找到标准化残差?【英文标题】:How to find the standardized residuals with sklearn? 【发布时间】:2021-03-17 10:56:53 【问题描述】:sklearn
有没有获得标准化残差的方法?
我创建了一个包含所有值、预测值和残差的数据框。
Weight Height Sex Age PredictedWeight Residual
81.0 177 0 31 81.2 -0.2
78.2 176 0 28 78.8 -0.6
72.5 172 1 29 71.8 0.7
... ... ... ... ... ...
我的代码:
from sklearn import linear_model
import pandas as pd
X = df[["Height", "Sex", "Age"]]
Y = df["Weight"]
regr = linear_model.LinearRegression()
regr.fit(X, Y)
df["PredictedWeight"] = regr.predict(df[["Height", "Sex", "Age"]])
df["Residual"] = df["Weight"] - df["Predicted"]
我想在df
中添加一个带有标准化残差的新列,有什么建议吗?
【问题讨论】:
【参考方案1】:我觉得很简单
mean = df["Residual"].mean()
std = df["Residual"].std()
df["StdResidual"] = (df["Residual"] - mean)/std
还是你想要别的东西?
【讨论】:
以上是关于如何使用 sklearn 找到标准化残差?的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 sklearn cross_val_score() 标准化数据