Pandas系列1-DataFrame之初始化

Posted 2023-04-28

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Pandas系列1-DataFrame之初始化相关的知识，希望对你有一定的参考价值。

参考技术A DataFrame有多种初始化方法，主要分为以下几种情况：

下面分别介绍：

这又分为以下几种方式

总的来说，如果容器对象是一个list，那么其中的item就是一条行记录，而如果是dict，那么就相当于列记录，即key对应的是column name，而values即为这一列的值，而values一般可以通过list存储，也可以通过Series对象存储。

通过1D data series初始化的时候，如果有多列，那么需要等长

注意与上边的dict of lists区分，如果最外层是dict，那么key值默认是column label。
而在list of dicts中，每个dict都是一个record，或者说一行

pandas通过各种数据文件也可以初始化，比如csv文件，excel文件，json文件，html文件等，详见下图

下面以 read_csv 详细解释下读取csv文件以及初始化的过程
read_csv 的完整文档参考 read_csv api ，下面通过示例对常用的parameter进行解释：

这里以MongoDB为例

这里需要注意的是如果不指定columns参数，有可能导致某些为空的field没有对应的列，如果指定了列名称，则如果相对应的域没有数据的话，就会自动置为nan

pandas DataFrame 的系列操作

创建空dataframe

1,data=pd.DataFrame()

2,data=pd.DataFrame(columns=[‘a‘,‘b‘,‘c‘,‘d‘])

删除列

data.drop(‘a‘,axis=1)

删除行

data.drop([0,1]) #按索引删除

以上是关于Pandas系列1-DataFrame之初始化的主要内容，如果未能解决你的问题，请参考以下文章

数据分析之pandas

pandas ExcelFile 是不是在初始化时解析所有工作表？（并且可以避免）

nopCommerce 3.9 大波浪系列之引擎 NopEngine

数据分析之Pandas

将列表或系列作为一行附加到 pandas DataFrame？

Pandas之groupby分组