数据分析&数据挖掘pandas——文件的读取与保存

Posted 2020-11-26 tree0108

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了数据分析&数据挖掘pandas——文件的读取与保存相关的知识，希望对你有一定的参考价值。

 1 import pandas as pd
 2 
 3 # 文本数据---人能够识别的有序的文件
 4 # csv 文件---以逗号分隔的，文本文件
 5 # pd.read_csv()
 6 # filepath_or_buffer 文件路径 + 名称
 7 # sep   delimiter  都是分隔符
 8 # header=‘infer‘,   自动识别列索引名称
 9 # names   可以自行指定 列名称
10 # index_col ---可以去指定把那一列，哪几列 作为行索引名称
11 # usecols  ---可以指定只获取 指定的列
12 # encoding ----设置编码
13 # nrows -可以指定读取的行数
14 info = pd.read_table(
15     filepath_or_buffer="../day05/meal_order_info.csv",
16     sep=",",
17     header="infer",  # 自动识别
18     # header=None, # 不指定列名
19     # header=0,  # 指定第0行位 列索引名称
20     encoding="ansi",
21     index_col= 0, # 把第0列设置为行索引名称
22     nrows=3,
23     usecols=[0,1],
24     names=["01","07"], # 可以自己设置列名
25     # usecols=["info_id","emp_id"]
26 )
27 
28 # 参数 参考read_table
29 info = pd.read_csv("../day05/meal_order_info.csv",encoding="ansi")
30 # print("info :
", info)
31 print("info 的类型:
", type(info))
32 
33 
34 # excel 表格文件，以.xlsx xls 结尾的文件
35 # io  路径+名称
36 # sheetname  表的序号
37 # index_col  参考read_table
38 # parse_cols  指定读取的列
39 users = pd.read_excel(
40     "../day05/users.xlsx",
41     sheetname=0,
42     parse_cols=[0, 1],  # 在某些版本起作用，
43 )
44 print("users:
", users)
45 
46 # pandas 读取文件
47 # pd.read_xxxx
48 
49 # 保存文件
50 # df.to_xxx
51 # 保存文本文件
52 # index  保存的时候 是否保存行索引
53 # mode --保存的模式
54 info.to_csv("../day05/info_save.csv",index=False)
55 info.to_csv("../day05/info_save.csv",index=False,mode="a")

以上是关于数据分析&数据挖掘pandas——文件的读取与保存的主要内容，如果未能解决你的问题，请参考以下文章

Python使用pandas & pymysql读取MySQL数据到csv文件中

Pandas从入门到实战（day1）

Python中基本的读文件和简单数据处理

数据分析&数据挖掘pandas时间数据

按单元格值提取 excel 数据：python PANDAS

2 Series&Pandas