数据蛙提高-pandas学习
Posted chentianwei
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据蛙提高-pandas学习相关的知识,希望对你有一定的参考价值。
read_csv
??不同参数的作用
- header默认为0,即第一行为表头,如果header=None,则0开始的数字作为表头,可以配合name=[]定义表头。
Series和DataFrame数据结构
to_frame(name=None)方法,把Series格式数据转化为DataFrame格式。
索引
使用索引我们就可以对数据进行选取和筛选
- 使用位置做索引
- 使用列表做索引
- 使用切片做索引
- 使用bool类型索引
loc方法
``.loc[]`` is primarily label based, but may also be used with a boolean array. 主要是基于标签,也可以使用布林数组。
- 内部参数可以使用单一的标签如1或"a"
- 一个list或array作为标签,如[‘a‘, ‘b‘, ‘c‘]
- 或切片‘a‘:‘f‘`,??这是双闭合的,
- 一个布林数组
- 一个带单一参数(Series,或DataFrame)的可调用函数并返回验证后的输出结果作为索引。
例子:
df.loc[df["年龄"]>40]
行列的形式:第一个参数是选行,第二个参数选择列
df.loc[[1,2,3], [‘年龄‘, "性别"]]
??第二个参数不能使用整数切片或整数行数。
?df.loc[0:3, [0,1,2]]
?df.loc[0:3, 0:2]
iloc方法
``.iloc[]`` is primarily integer position based (from ``0`` to ``length-1`` of the axis), but may also be used with a boolean array.
基于整数位置的,默认0代表第一行或第一列。iloc的字母i就代表integer
可以输入的参数是:
- 一个整数
- 一个list,或整数型的array, 如[4, 5]
- 整数切片, ??左闭合,右开放。
- 一个布林数组
- 一个带单一参数(Series,或DataFrame)的可调用函数并返回验证后的输出结果作为索引。
行列的形式:第一个参数是选行,第二个参数选择列。
df.iloc[0:3, 0:2]
等同于
df.iloc[0:3, [0,1,2]]
??只能用整数。不能使用具体的列名字。
以上是关于数据蛙提高-pandas学习的主要内容,如果未能解决你的问题,请参考以下文章
pandas GroupBy上的方法apply:一般性的“拆分-应用-合并”