使用 rlm 计算稳健回归的 r 平方是不是合适

Posted

技术标签:

【中文标题】使用 rlm 计算稳健回归的 r 平方是不是合适【英文标题】:Is it appropriate to calculate r-squared of robust regression using rlm使用 rlm 计算稳健回归的 r 平方是否合适 【发布时间】:2020-05-21 05:36:56 【问题描述】:

我正在使用 MASS 的 rlm 函数来执行稳健的回归。与 lm 不同,summary 函数不返回 r-squared 的值。

因此适合使用1 - sum(residual^2)/(sum((Y-mean(Y))^2)? 进行计算

(对于方程的道歉,我不知道如何以更好的格式编写它)

【问题讨论】:

这个问题已经在 stats stackexchange 网站here有答案了 感谢您的回复。感谢您帮助我指出正确的方向 【参考方案1】:

当数据有很多异常值时,使用稳健线性回归(rlm)代替线性回归(lm);它也可以用于检测有影响的观察。 稳健回归使用迭代重加权最小二乘法 (IRLS) 进行最大似然估计 (MLE),而线性回归使用普通最小二乘法 (OLS),这就是 lm() 而不是 rlm 返回 R-squared(确定系数)的原因()。

现在谈到适当性,它不是评估稳健回归拟合的合适度量,因为它涉及计算公式中的平方损失=sum(residual^2)=sum(predicted values-observed values)^2 r平方。由于稳健回归涉及处理包含许多异常值的数据,因此该度量将导致荒谬的值,因为异常值的残差会产生较大的值,而且这些值很大并且是平方的! 这就是为什么在涉及异常值时使用 absolute loss=(predict-actual) 来评估拟合的原因。

希望这会有所帮助。

【讨论】:

谢谢尼扎姆。这很有意义。感谢您的回复。

以上是关于使用 rlm 计算稳健回归的 r 平方是不是合适的主要内容,如果未能解决你的问题,请参考以下文章

Stata和R中Logit回归的不同稳健标准误差

R语言计算回归模型残差平方和(Residual Sum of Squares)实战,并基于残差平方和比较模型优劣

R语言用于线性回归的稳健方差估计

R语言在逻辑回归中求R square R方

拓端tecdat|R语言代码编写相关分析和稳健线性回归分析

R语言对回归模型进行协方差分析