如何使用 sklearn 找到标准化残差?

Posted

技术标签:

【中文标题】如何使用 sklearn 找到标准化残差?【英文标题】:How to find the standardized residuals with sklearn? 【发布时间】:2021-03-17 10:56:53 【问题描述】:

sklearn 有没有获得标准化残差的方法? 我创建了一个包含所有值、预测值和残差的数据框。

Weight  Height  Sex  Age  PredictedWeight  Residual
81.0    177     0    31   81.2             -0.2
78.2    176     0    28   78.8             -0.6
72.5    172     1    29   71.8              0.7
...     ...     ...  ...  ...               ...

我的代码:

from sklearn import linear_model
import pandas as pd

X = df[["Height", "Sex", "Age"]]
Y = df["Weight"]

regr = linear_model.LinearRegression()
regr.fit(X, Y)

df["PredictedWeight"] = regr.predict(df[["Height", "Sex", "Age"]])
df["Residual"] = df["Weight"] - df["Predicted"]

我想在df 中添加一个带有标准化残差的新列,有什么建议吗?

【问题讨论】:

【参考方案1】:

我觉得很简单

mean = df["Residual"].mean()
std = df["Residual"].std()

df["StdResidual"] = (df["Residual"] - mean)/std

还是你想要别的东西?

【讨论】:

以上是关于如何使用 sklearn 找到标准化残差?的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 sklearn cross_val_score() 标准化数据

如何在 Python 中计算学生化残差?

使用 sklearn,我如何找到决策树的深度?

如何使用sklearn找到最接近K的点的索引意味着聚类中心?

标准化 sklearn 中的回归器

在sklearn python中撤消L2规范化