python和R对dataframe的分组聚合操作:dplyrgroupbyagggroup_bynuniquereset_indexrenamesummarisen_distinct

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python和R对dataframe的分组聚合操作:dplyrgroupbyagggroup_bynuniquereset_indexrenamesummarisen_distinct相关的知识,希望对你有一定的参考价值。

python和R对dataframe的分组聚合操作:dplyr、groupby、agg、group_by、nunique、reset_index、rename、summarise、n_distinct

#  仿真数据集

import pandas as pd
import numpy as np

data = {\'产品\':[\'肉类\',\'盐铁\',\'纺织\',\'木材\']*2,
        \'年份\':[1046,1046,1046,1046,1047,1047,1047,1047],
       \'诸侯\':[\'秦\',\'齐\',\'楚\',\'燕\',\'赵\',\'魏\',\'韩\',\'西周\'],
       \'产量\':[180,140,300,200,150,60,80,320],
       \'收益\':[1800,1400,3000,2000,1500,600,800,3200]}

df=pd.DataFrame(data, columns=[\'产品\',\'年份\',\'诸侯\',\'产量\',\'收益\'])

df

以上是关于python和R对dataframe的分组聚合操作:dplyrgroupbyagggroup_bynuniquereset_indexrenamesummarisen_distinct的主要内容,如果未能解决你的问题,请参考以下文章

Pandas Dataframe 中分组的多重聚合

数据分析—Pandas 中的分组聚合Groupby 高阶操作

pandas聚合和分组运算之groupby

R语言dplyr包获取dataframe分组聚合汇总统计值实战(group_by() and summarize() ):均值中位数分位数IQRMADcountunique

pandas使用groupby函数基于指定分组变量对dataframe数据进行分组使用mean函数计算每个分组中的所有数值变量的聚合平均值

pandas使用groupby函数基于指定分组变量对dataframe数据进行分组使用sum函数计算每个分组中的所有数值变量的聚合加和值