利用Python进行数据分析-Pandas(第五部分-数据规整:聚合合并和重塑)

Posted 阑珊夜泊

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用Python进行数据分析-Pandas(第五部分-数据规整:聚合合并和重塑)相关的知识,希望对你有一定的参考价值。

  在许多应用中,数据可能分散在许多文件或数据库中,存储的形式也不利于分析。本部分关注可以聚合、合并、重塑数据的方法。

1、层次化索引

  层次化索引(hierarchical indexing)是pandas的一项重要功能,它使你能在一个轴上拥有多个(两个以上)索引级别。抽象点说,它使你能以低纬度形式处理高纬度数据。我们来看一个简单的栗子:创建一个Series,并用一个由列表或数组组成的列表作为索引:

data = pd.Series(np.random.randn(9), index=[[a, a, a, b, b, c, c, d, d], [1, 2, 3, 1, 3, 1, 2, 2, 3]])
print(data)
a  1   -1.624220
   2   -1.061747
   3    0.895593
b  1   -2.702315
   3   -1.690189
c  1    2.608471
   2    1.167507
d  2    0.139161
   3    1.298629
dtype: float64

看到的结果是经过美化的带有MultiIndex索引的Series的格式。索引之间的“间隔”表示“直接使用上面的标签”:

print(data.index)
MultiIndex([(‘a‘, 1),
            (‘a‘, 2),
            (‘a‘, 3),
            (‘b‘, 1),
            (‘b‘, 3),
            (‘c‘, 1),
            (‘c‘, 2),
            (‘d‘, 2),
            (‘d‘, 3)],
           )

对于一个层次化索引的对象,可以使用所谓的部分索引

 

持续更新中......

以上是关于利用Python进行数据分析-Pandas(第五部分-数据规整:聚合合并和重塑)的主要内容,如果未能解决你的问题,请参考以下文章

利用Python进行数据分析——pandas入门

利用Python进行数据分析:Pandas(Series+DataFrame)

Python数据分析之pandas学习

Python数据分析之pandas学习

《利用Python进行数据分析》之pandas的时间序列基础

python 数据分析--pandas