DataFrame
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了DataFrame相关的知识,希望对你有一定的参考价值。
参考技术A DataFrame是一种表格型数据结构,它含有一组有序的列,每列可以是不同的值。DataFrame既有行索引,也有列索引,它可以看作是由Series组成的字典,不过这些Series公用一个索引。values,columns,index,shape
若索引为汉字,有时无法检索结果
访问dataframe的列,有两种方法,返回series
访问指定行,返回series
取出某个值或修改某个值
参数:
isnull().any() -----表示此行/列 存在数据为空就为true ,若此行/列 数据都存在 则为false
notnull().all() -----表示此行/列 所有数据都存在则为true,否则为false
how='any' ----表示此行/列 存在空数据时删除
how='all' ----表示此行/列 全为空数据时删除
函数内部参数:
列多层索引与行多层索引相似
merge 与 concat 的区别在于,merge 需要依据共同的一行或列进行合并
使用 pd.merge() 进行合并时,会自动根据两者相同 column 名称的那一列,作为key 来进行合并
若列名相同列的数据不同,则取其公共部分:
若列名相同列的数据存在一对多个的情况,则展示多个;
在多对多进行合并时,每一个数据都没有放过
当存在多列相同时,指定key为哪列
只保留两者都有的 key (默认模式)
how = 'outer' : 空缺处补 NaN
pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个dataframe(split dataframe based on column value threshold
pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个子dataframe(split dataframe based on column value threshold)
目录
以上是关于DataFrame的主要内容,如果未能解决你的问题,请参考以下文章