pandas基础操作
Posted yu121
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas基础操作相关的知识,希望对你有一定的参考价值。
Pandas基于两种数据类型: series 与 dataframe
Series:是一个一维的数据类型
DataFrame:是一个二维的表结构
选择/切片
df[‘code‘] # 选取一列,生成一个Series
df[[‘code‘]] # 选取一列,生成一个DataFrame
df[[‘code‘, ‘unit‘]] # 选取多列
df[1:3] #第1行到第2行(不含第3行)
loc,在知道列名字的情况下,df.loc[index,column] 选取指定行,列的数据
iloc完全用数字来定位 iloc[row_index, column_index]
isin 过滤
df[df[‘unit‘].isin([‘1单元‘])
缺省项
# pandas 中使用np.nan作为缺省项的值
# 删除所有带有缺省项的行 :df.dropna(how = ‘any)
# 填充缺省项:df.fillna(value = 7)
# 获得缺省项的布尔掩码:pd.isnull(df)
观察操作
# 前几行数据
df.head()
# 显示索引
df.index
# 显示列
df.columns
# 转置
df.T
参考文档:http://www.data-master.net/80533003
以上是关于pandas基础操作的主要内容,如果未能解决你的问题,请参考以下文章
pandas GroupBy上的方法apply:一般性的“拆分-应用-合并”