pandas数据结构和介绍第一天
Posted 冰滴的眼泪
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas数据结构和介绍第一天相关的知识,希望对你有一定的参考价值。
pandans另种主要的数据结构Series和DateFranme
1,Series
仅由一组数据就而已产生简单的Series
2)Series 有index和values属性,表达索引对象
3)设置索引和取值
4)把数据存放到字典,也可以通过字典建立Series
DataFrame
1,是一种表格行的数据结构,它包含一组有序的列,既有行索引也有列索引,
2,指定顺序排列 用columns
3,取值是可Series取值一样,这边多啦一个ix取值方式,主要是安装列索引来取值,赋值
4,
· 4.DateFrame取值方式 切片,ix,reindex,xs,icol,irow,get_value,set_value
5,xs取值需要注意下
三:算术运算和数据对齐
pandas最重要的一个功能是,它可以对不同索引的对象进行算术运算,在将对象相加时,如果存在不同的索引是,则结果的索引就是该索引对的并集
Data相加,如果是nan可以设置为填充值 fill_value,需要用到算法add相加,sub减法,div除fa,mul乘法
四 Series和DataFrane之间的 运算
比如计算差值
五:函数的应用和映射,apply方法 lambsa
六,排序和排名 sort_index order 按字典左右排序可以用sort_index 按值排序可以order,DateFaemr里面sort_index(by=’‘),,,
排名rank
按值进行排序 如果是缺失值,会被放到最后
DataFrame 可以根据一个或者多个列中的值进行排序,讲一个或多个列的名字传递给by选项即可达到目标
排名 rank
命名是用于破坏平衡关系的method的选项
aVerage 默认,在相等分组中,为各值分配平均排名
min 使用整个分组的最小排名
max 使用整个分组的最大排名
first 按值在原始数据中出现顺序分配排名
七,带有重复值的轴索引
is_unique用于检查是不是唯一性,,pandas用于判断是有缺失值 pd.isnull(数据名),notnull(数据名),而Series判断则是 数据名。isnull()
以上是关于pandas数据结构和介绍第一天的主要内容,如果未能解决你的问题,请参考以下文章
pandas通过DatetimeProperties对象获取日期对象是否是所在月份的最后一天(is month end)筛选dataframe数据中日期对象是所在月份最后一天的数据行
pandas通过DatetimeProperties对象获取日期对象是否是所在年份的第一天(is year start)筛选dataframe数据中日期对象是所在年份第一天的数据行
pandas通过DatetimeProperties对象获取日期对象是否是所在季度的第一天(is quarter start)筛选dataframe数据中日期对象是所在季度第一天的数据行
pandas通过DatetimeProperties对象获取日期对象是否是所在季度的最后一天(is quarter end)筛选dataframe数据中日期对象是所在季度最后一天的数据行