Pandas-分组函数和分层索引的展开

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas-分组函数和分层索引的展开相关的知识,希望对你有一定的参考价值。

参考技术A 在处理数据的时候经常会用到分组,类似于SQL中的group by,按照group by后面接的字段来分成组,之后再进行其他处理。

Pandas中内置了类似的方法,用法简要如下:

这个意思就是,按照Pclass和Embarked两列取笛卡尔积为组别,然后针对每一组计数。

可以看到,用两列分组的话,出来的索引是分层的。

接下来,用
df_test.index = df_test.index.ravel()
该函数是将拼合的基础数据作为 ndarray 返回。
这里,index就是一组Series,那么正好能返回一个ndarray,把这个ndarry作为index即可。

以上是关于Pandas-分组函数和分层索引的展开的主要内容,如果未能解决你的问题,请参考以下文章

100天精通Python(数据分析篇)——第64天:Pandas分组groupby函数案例

Pandas学习总结——3. Pandas分组

pandas使用groupby函数基于指定分组变量对dataframe数据进行分组len函数和nunique函数计算分组的个数(分组包含多个dataframe)

Pandas分组统计与时间序列

pandas中的分组技术

python使用pandas计算dataframe中每个分组的极差分组数据的极差(range)使用groupby函数和agg函数计算分组的最大值和最小值