Python学习教程:实战-用Pandas做多层级索引

Posted cherry-tang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python学习教程:实战-用Pandas做多层级索引相关的知识,希望对你有一定的参考价值。

有的伙伴想学用Pandas做多层级索引,但不知道从何学起,难度肯定会有的,还是得掌握方法的!

Pandas库的名字来源于其中3种主要数据结构开头字母的缩写:Panel,Dataframe,Series。其中Series表示一维数据,Dataframe表示二维数据,Panel表示三维数据。当数据高于二维时,一般却不用 Panel 表示,为什么呢?如果不用 Panel,又该怎么做呢?

实际上,当数据高于二维时,我们一般用包含多层级索引的Dataframe进行表示,而不是使用Panel。原因是使用多层级索引展示数据更加直观,操作数据更加灵活,并且可以表示3维,4维乃至任意维度的数据。具体要怎么做呢?下面我们就从多层级索引的创建、取值与操作等内容教大家一些方法!

一、多层级索引的创建

1、指定多维列表作为columns

 

技术图片

 

 

2、使用pd.MultiIndex中的方法显式生成多层级索引

可以使用pd.MultiIndex中的from_tuples等方法生成多层级索引。

 

技术图片

 

 

3、使用set_index方法将普通列转成多层级索引

这种方法只能生成多层级行索引。

 

技术图片

 

 

 

技术图片

 

 

技术图片

 

 

 

4、groupby和pivot_table等方法也可以生成带有多层级索引的结果

 

技术图片

 

 

技术图片

 

 

技术图片

 

 

二、多层级索引的取值

多层级索引Series或多层级DataFrame支持方括号直接取值,loc取值,和pd.IndexSlice切片取值等方法。

1、多层级Series的取值

 

技术图片

 

 

 

 

技术图片

 

 

技术图片

 

 

技术图片

 

 

 

2、多层级DataFrame的取值

 

技术图片

 

 

 

 

技术图片

 

 

技术图片

 

 

技术图片

 

 

技术图片

 

 

技术图片

 

 

技术图片

 

 

三、多层级索引相关操作

多层级索引相关操作包括stack和unstack,set_index和reset_index,以及指定level的相关方法。

1、stack和unstack

 

技术图片

 

 

技术图片

 

 

技术图片

 

 

 

2、set_index和reset_index

 

技术图片

 

 

技术图片

 

 

 

3、指定level的相关方法

 

技术图片

 

 

技术图片

 

 

 

 

技术图片

 

 

技术图片

 

 

伙伴们那些地方不清楚的可以留言哦!

以上是关于Python学习教程:实战-用Pandas做多层级索引的主要内容,如果未能解决你的问题,请参考以下文章

Pandas 多层级索引 Python 数据处理案例指南

Pandas 多层级索引的数据分析案例,超干货!

Pandas多层级索引的数据分析案例,超干货的!

Python数据分析pandas之多层高维索引

pandas层次化索引

高端实战 Python数据分析与机器学习实战 Numpy/Pandas/Matplotlib等常用库