pandas基础: Series和DataFrame的简单介绍
Posted KévinX
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas基础: Series和DataFrame的简单介绍相关的知识,希望对你有一定的参考价值。
一、pandas 是什么
pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析。它提供了大量高级的数据结构和对数据处理的方法。
pandas 有两个主要的数据结构:Series 和 DataFrame。
二、Series
Series 是一个一维数组对象 ,类似于 NumPy 的一维 array。它除了包含一组数据还包含一组索引,所以可以把它理解为一组带索引的数组。
将 Python 数组转换成 Series 对象:
![](https://image.cha138.com/20210606/5d0850f883014ae7a14a9c08d49f4710.jpg)
将 Python 字典转换成 Series 对象:
![](https://image.cha138.com/20210606/236441d19f724aebab81af3988c29be1.jpg)
当没有显示指定索引的时候,Series 自动以 0 开始,步长为 1 为数据创建索引。
你也可以通过 index 参数显示指定索引:
![](https://image.cha138.com/20210606/8170896b203941a6bb0138692da69dbf.jpg)
对于 Series 对象里的单个数据来说,和普通数组一样,根据索引获取对应的数据或重新赋值;
不过你还可以传入一个索引的数组来获取数据或未数据重新赋值:
![](https://image.cha138.com/20210606/fd57b5eb80524d92ae2721d66d80630f.jpg)
想要单独获取 Series 对象的索引或者数组内容的时候,可以使用 index 和 values 属性,例如:
![](https://image.cha138.com/20210606/554f846afd9d447db0457c71e33547a1.jpg)
对 Series 对象的运算(索引不变):
![](https://image.cha138.com/20210606/47f267cd53a64c4dbbe3ff586b19a0d8.jpg)
三、DataFrame
DataFrame 是一个表格型的数据结构。它提供有序的列和不同类型的列值。
例如将一个由 NumPy 数组组成的字典转换成 DataFrame 对象:
![](https://image.cha138.com/20210606/ca2969d741d647919e382ee29fb7d388.jpg)
DataFrame 默认根据列名首字母顺序进行排序,想要指定列的顺序?传入一个列名的字典即可:
![](https://image.cha138.com/20210606/06924ebfdbff4484884dbcd19cf3072c.jpg)
如果传入的列名找不到,它不会报错,而是产生一列 NA 值:
![](https://image.cha138.com/20210606/57ca5152066d4efe9c505c4a2433ea0d.jpg)
DataFrame 不仅可以以字典索引的方式获取数据,还可以以属性的方法获取,例如:
![](https://image.cha138.com/20210606/13de02ffc51649cca67b9c4063be216d.jpg)
修改列的值:
![](https://image.cha138.com/20210606/d7a4c53cf9fb419b97c03c039c759f0f.jpg)
删除某一列:
![](https://image.cha138.com/20210606/e20b6ef97d34452ebdf78cf0920ebfdb.jpg)
以上是关于pandas基础: Series和DataFrame的简单介绍的主要内容,如果未能解决你的问题,请参考以下文章
pandas一些基本操作(DataFram和Series)_1