pandas数据结构和介绍第一天

Posted 冰滴的眼泪

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas数据结构和介绍第一天相关的知识,希望对你有一定的参考价值。

 

 

pandans另种主要的数据结构Series和DateFranme

1,Series

仅由一组数据就而已产生简单的Series

    2)Series 有index和values属性,表达索引对象

   

  3)设置索引和取值

  

  

  4)把数据存放到字典,也可以通过字典建立Series

  

 

 

DataFrame

  1,是一种表格行的数据结构,它包含一组有序的列,既有行索引也有列索引,

  

  2,指定顺序排列 用columns

    

  3,取值是可Series取值一样,这边多啦一个ix取值方式,主要是安装列索引来取值,赋值

    

    

 

  4,

     

·  4.DateFrame取值方式 切片,ix,reindex,xs,icol,irow,get_value,set_value

 

  5,xs取值需要注意下

    

 

   

 

 三:算术运算和数据对齐

  pandas最重要的一个功能是,它可以对不同索引的对象进行算术运算,在将对象相加时,如果存在不同的索引是,则结果的索引就是该索引对的并集

  

   Data相加,如果是nan可以设置为填充值  fill_value,需要用到算法add相加,sub减法,div除fa,mul乘法

  

  

  四  Series和DataFrane之间的 运算

  比如计算差值

  

  

 

  

  

  五:函数的应用和映射,apply方法 lambsa

  

 

  

六,排序和排名  sort_index  order  按字典左右排序可以用sort_index  按值排序可以order,DateFaemr里面sort_index(by=’‘),,,

  排名rank

  

  

  按值进行排序  如果是缺失值,会被放到最后

  DataFrame 可以根据一个或者多个列中的值进行排序,讲一个或多个列的名字传递给by选项即可达到目标

  

 

  排名  rank

  命名是用于破坏平衡关系的method的选项

  aVerage   默认,在相等分组中,为各值分配平均排名

  min  使用整个分组的最小排名

  max 使用整个分组的最大排名

  first 按值在原始数据中出现顺序分配排名

 

  

 

七,带有重复值的轴索引

  is_unique用于检查是不是唯一性,,pandas用于判断是有缺失值 pd.isnull(数据名),notnull(数据名),而Series判断则是   数据名。isnull()

  

 

 

    

 

  

 

  

 

  

 

 

 

  

    

 

  

 

 

  

 

 

    

 

以上是关于pandas数据结构和介绍第一天的主要内容,如果未能解决你的问题,请参考以下文章

使用 pandas 的滚动窗口计算一天中每个时间的平均值

如何在 Pandas 中覆盖“一天期间”的数据以进行绘图

pandas通过DatetimeProperties对象获取日期对象是否是所在月份的最后一天(is month end)筛选dataframe数据中日期对象是所在月份最后一天的数据行

pandas通过DatetimeProperties对象获取日期对象是否是所在年份的第一天(is year start)筛选dataframe数据中日期对象是所在年份第一天的数据行

pandas通过DatetimeProperties对象获取日期对象是否是所在季度的第一天(is quarter start)筛选dataframe数据中日期对象是所在季度第一天的数据行

pandas通过DatetimeProperties对象获取日期对象是否是所在季度的最后一天(is quarter end)筛选dataframe数据中日期对象是所在季度最后一天的数据行