Pandas系列1-DataFrame之初始化

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas系列1-DataFrame之初始化相关的知识,希望对你有一定的参考价值。

参考技术A DataFrame有多种初始化方法,主要分为以下几种情况:

下面分别介绍:

这又分为以下几种方式

总的来说,如果容器对象是一个list,那么其中的item就是一条行记录,而如果是dict,那么就相当于列记录,即key对应的是column name,而values即为这一列的值,而values一般可以通过list存储,也可以通过Series对象存储。

通过1D data series初始化的时候,如果有多列,那么需要等长

注意与上边的dict of lists区分,如果最外层是dict,那么key值默认是column label。
而在list of dicts中,每个dict都是一个record,或者说一行

pandas通过各种数据文件也可以初始化,比如csv文件,excel文件,json文件,html文件等,详见下图

下面以 read_csv 详细解释下读取csv文件以及初始化的过程
read_csv 的完整文档参考 read_csv api ,下面通过示例对常用的parameter进行解释:

这里以MongoDB为例

这里需要注意的是如果不指定columns参数,有可能导致某些为空的field没有对应的列,如果指定了列名称,则如果相对应的域没有数据的话,就会自动置为nan

pandas DataFrame 的系列操作

创建空dataframe

1,data=pd.DataFrame()

2,data=pd.DataFrame(columns=[‘a‘,‘b‘,‘c‘,‘d‘])

删除列

data.drop(‘a‘,axis=1)

删除行

data.drop([0,1])  #按索引删除

 

以上是关于Pandas系列1-DataFrame之初始化的主要内容,如果未能解决你的问题,请参考以下文章

数据分析之pandas

pandas ExcelFile 是不是在初始化时解析所有工作表? (并且可以避免)

nopCommerce 3.9 大波浪系列 之 引擎 NopEngine

数据分析之Pandas

将列表或系列作为一行附加到 pandas DataFrame?

Pandas之groupby分组