pandas

Posted liujianing

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas相关的知识,希望对你有一定的参考价值。

可以把pandas看作是numpy的字典形式

array == Series            一维

array == DataFrame     二维

DataFrame有两种初始化方式:1、利用numpy(可以指定行名称和列名称)   2、利用字典

数组选择:默认按列索引,

     loc按标签索引,

     iloc按数字索引(切片时可以利用数组进行不连续索引)

     ix按标签和数字混合索

     利用逻辑索引:df.B[df.A > 0] = 0,A这一列大于0的数赋值为0

     df[‘F‘]=np.nan 增加F这一列

 

常用属性:

  dtypes:查看各列的类型

  index:行名称

  columns:列名称

  values:所有值

  T:转置

 

常用函数:

  describe():统计所有数字类型的列的均值、方差、最值等

  sort_values(by=列名)按某一列进行排序

  dropna(axis=0,how=‘any‘)how的值默认为any,表示该列有人以一个nan即删除整个列,若选择all,则只有该列全为nan时才删除该列

  fillna(value=0)

  np.any(df.isnull())== True  查看是否含有空值

  head()前五个数据

  

导入导出数据:

  read_csv

  to_csv

 

数据合并: 

  append([df1, df2, df3],axis=0,ignore_index=True)

  concat([df1, df2, df3],axis=0,ignore_index=True,join=‘inner‘,join_axes=[df1.index]) 

    ignore_index:使index重新排序

    join:inner只保留相同的部分、outer空白部分用nan填充

    join_axes:选择依据的表

  merge(pd1,pd2,on=[列名],how=)                按列合并

    how:left、right、inner(默认)、outer

  merge(pd1,pd2,left_index=True,right_index=True,how)   按行合并

以上是关于pandas的主要内容,如果未能解决你的问题,请参考以下文章

PandasPandas Daframe 常用用法

pandaspandas.to_datatime()---时间格式转换

pandaspandas.Series.str.split()---字符串分割

PandasPandas处理Csv和Excel数据详解

PandasPandas处理Csv和Excel数据详解

PandasPandas处理Csv和Excel数据详解