Python Dataframe:在一列上使用Groupby计算R ^ 2和RMSE

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python Dataframe:在一列上使用Groupby计算R ^ 2和RMSE相关的知识,希望对你有一定的参考价值。

我有以下Python数据帧:

Type    Actual  Predicted
A       4       3
A       10      18
A       13      11
B       3       10
B       4       2
B       8       33
C       20      17
C       40      33
C       87      80
C       32      30

我有代码来计算R ^ 2和RMSE,但我不知道如何通过不同的“类型”来计算它。

现在,我的方法是将较大的表分成三个较小的表,只包含A,B,C值,然后从每个较小的表中计算R ^ 2和RMSE ......然后将它们重新附加在一起。

但上述方法效率低下,我相信应该有更简单的方法吗?

下面是我希望结果在事物分组时产生的格式:

Type    R^2     RMSE    
A       value   value   
B       value   value   
C       value   value   
答案

这是一个groupby方法:

import numpy as np
import pandas as pd
from sklearn.metrics import r2_score, mean_squared_error

def r2_rmse( g ):
    r2 = r2_score( g['Actual'], g['Predicted'] )
    rmse = np.sqrt( mean_squared_error( g['Actual'], g['Predicted'] ) )
    return pd.Series( dict(  r2 = r2, rmse = rmse ) )

your_df.groupby( 'Type' ).apply( r2_rmse ).reset_index()

以上是关于Python Dataframe:在一列上使用Groupby计算R ^ 2和RMSE的主要内容,如果未能解决你的问题,请参考以下文章

内连接恰好在一列上,而在另一列上模糊

如何在 Pandas Dataframe Python 中使用科学计数法显示小数字?

在一列上设置过滤器和提供的过滤器 - Ag-Grid

在一列上排名表,同时在另一列上排序

如何通过 OBIEE 在一列上显示某些值?

在一列上汇总数据框,同时保留其他列