Python Dataframe:在一列上使用Groupby计算R ^ 2和RMSE
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python Dataframe:在一列上使用Groupby计算R ^ 2和RMSE相关的知识,希望对你有一定的参考价值。
我有以下Python数据帧:
Type Actual Predicted
A 4 3
A 10 18
A 13 11
B 3 10
B 4 2
B 8 33
C 20 17
C 40 33
C 87 80
C 32 30
我有代码来计算R ^ 2和RMSE,但我不知道如何通过不同的“类型”来计算它。
现在,我的方法是将较大的表分成三个较小的表,只包含A,B,C值,然后从每个较小的表中计算R ^ 2和RMSE ......然后将它们重新附加在一起。
但上述方法效率低下,我相信应该有更简单的方法吗?
下面是我希望结果在事物分组时产生的格式:
Type R^2 RMSE
A value value
B value value
C value value
答案
这是一个groupby
方法:
import numpy as np
import pandas as pd
from sklearn.metrics import r2_score, mean_squared_error
def r2_rmse( g ):
r2 = r2_score( g['Actual'], g['Predicted'] )
rmse = np.sqrt( mean_squared_error( g['Actual'], g['Predicted'] ) )
return pd.Series( dict( r2 = r2, rmse = rmse ) )
your_df.groupby( 'Type' ).apply( r2_rmse ).reset_index()
以上是关于Python Dataframe:在一列上使用Groupby计算R ^ 2和RMSE的主要内容,如果未能解决你的问题,请参考以下文章