使用 rlm 计算稳健回归的 r 平方是不是合适
Posted
技术标签:
【中文标题】使用 rlm 计算稳健回归的 r 平方是不是合适【英文标题】:Is it appropriate to calculate r-squared of robust regression using rlm使用 rlm 计算稳健回归的 r 平方是否合适 【发布时间】:2020-05-21 05:36:56 【问题描述】:我正在使用 MASS 的 rlm 函数来执行稳健的回归。与 lm 不同,summary 函数不返回 r-squared 的值。
因此适合使用1 - sum(residual^2)/(sum((Y-mean(Y))^2)?
进行计算
(对于方程的道歉,我不知道如何以更好的格式编写它)
【问题讨论】:
这个问题已经在 stats stackexchange 网站here有答案了 感谢您的回复。感谢您帮助我指出正确的方向 【参考方案1】:当数据有很多异常值时,使用稳健线性回归(rlm)代替线性回归(lm);它也可以用于检测有影响的观察。 稳健回归使用迭代重加权最小二乘法 (IRLS) 进行最大似然估计 (MLE),而线性回归使用普通最小二乘法 (OLS),这就是 lm() 而不是 rlm 返回 R-squared(确定系数)的原因()。
现在谈到适当性,它不是评估稳健回归拟合的合适度量,因为它涉及计算公式中的平方损失=sum(residual^2)=sum(predicted values-observed values)^2 r平方。由于稳健回归涉及处理包含许多异常值的数据,因此该度量将导致荒谬的值,因为异常值的残差会产生较大的值,而且这些值很大并且是平方的! 这就是为什么在涉及异常值时使用 absolute loss=(predict-actual) 来评估拟合的原因。
希望这会有所帮助。
【讨论】:
谢谢尼扎姆。这很有意义。感谢您的回复。以上是关于使用 rlm 计算稳健回归的 r 平方是不是合适的主要内容,如果未能解决你的问题,请参考以下文章