数据蛙提高-pandas学习

Posted chentianwei

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据蛙提高-pandas学习相关的知识,希望对你有一定的参考价值。

read_csv

??不同参数的作用

  • header默认为0,即第一行为表头,如果header=None,则0开始的数字作为表头,可以配合name=[]定义表头。

 

Series和DataFrame数据结构

to_frame(name=None)方法,把Series格式数据转化为DataFrame格式。

 

索引

使用索引我们就可以对数据进行选取和筛选

  1. 使用位置做索引
  2. 使用列表做索引
  3. 使用切片做索引
  4. 使用bool类型索引

loc方法

``.loc[]`` is primarily label based, but may also be used with a boolean array. 主要是基于标签,也可以使用布林数组。

  • 内部参数可以使用单一的标签如1或"a"
  • 一个list或array作为标签,如[‘a‘, ‘b‘, ‘c‘]
  • 或切片‘a‘:‘f‘`,??这是双闭合的, 
  • 一个布林数组
  • 一个带单一参数(Series,或DataFrame)的可调用函数并返回验证后的输出结果作为索引。

例子:

df.loc[df["年龄"]>40]

 

行列的形式:第一个参数是选行,第二个参数选择列

df.loc[[1,2,3], [年龄, "性别"]]

??第二个参数不能使用整数切片或整数行数。

?df.loc[0:3, [0,1,2]]
?df.loc[0:3, 0:2]

 

 

 

iloc方法

``.iloc[]`` is primarily integer position based (from ``0`` to ``length-1`` of the axis), but may also be used with a boolean array.

基于整数位置的,默认0代表第一行或第一列。iloc的字母i就代表integer

可以输入的参数是:

  •  一个整数
  • 一个list,或整数型的array, 如[4, 5]
  • 整数切片, ??左闭合,右开放。
  • 一个布林数组
  • 一个带单一参数(Series,或DataFrame)的可调用函数并返回验证后的输出结果作为索引。

行列的形式:第一个参数是选行,第二个参数选择列。

df.iloc[0:3, 0:2]
等同于
df.iloc[0:3, [0,1,2]]

 

 ??只能用整数。不能使用具体的列名字。

 

以上是关于数据蛙提高-pandas学习的主要内容,如果未能解决你的问题,请参考以下文章

提高组模拟赛总结

钛方蛙数据挖掘商业实验室

pandas GroupBy上的方法apply:一般性的“拆分-应用-合并”

text [检查特定的数据片段]取自论文但有意思应用。 #python #pandas

期望DP概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解

期望DP概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解