04 pandas DataFrame_创建、文件读取、编码

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了04 pandas DataFrame_创建、文件读取、编码相关的知识,希望对你有一定的参考价值。

参考技术A 定义:数据帧 (DataFrame) 是二维数据结构,即数据以行和列的表格方式排列。

特点:
1、 潜在的列是不同的类型
2、 大小可变
3、 标记轴是行和列 (行、列索引)
4、 可以对行和列进行算数运算

1、使用列表创建[]

2、使用字典创建

3、 使用数组创建 column行索引,index列索引

1、sheet_name 表格的小表名

2、 把哪一列当作行索引 index_col

3、 set_index("列名") 更改某一列为行索引

4、 reset_index(drop=True) 重置行索引,并把行索引转换为数据列
drop=True 不想要学号,即把行索引数据删除

1、读取csv文件

2、 从第I行开始作为列索引
header=None或数字
NONE 说明文件里面没有设置列索引,不把第一行当索引了
0,1 行当索引。默认是第0行

3、 加列索引

4、编码 、解析引擎
encoding 编码 默认utf-8 Windows新建文件,gb2312,gbk
engine 解析引擎 c比较快 python支撑更多方法

以上是关于04 pandas DataFrame_创建、文件读取、编码的主要内容,如果未能解决你的问题,请参考以下文章

Pandas库02_DataFrame数据结构

Pandas笔记 · DataFrame常用API参考

Python Pandas将多个dataframe写入Excel文件

Python Pandas将多个dataframe写入Excel文件

Pandas笔记 · DataFrame常用API参考

Pandas笔记 · DataFrame常用API参考