python之panda模块2
Posted Recently 祝祝
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python之panda模块2相关的知识,希望对你有一定的参考价值。
上一节中说了Python的基础数据结构,这一节我来总结一下我所学到的pandas的部分知识点:
Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据
1:pandas读取数据:
data = pd.read_csv( my_file.csv )
data = pd.read_csv( my_file.csv , sep= ; , encoding= latin-1 , nrows=1000, skiprows=[2,5])
sep 代表的是分隔符。如果你在使用法语数据,excel 中 csv 分隔符是「;」,因此你需要显式地指定它。
编码设置为 latin-1 来读取法语字符。
nrows=1000 表示读取前 1000 行数据。
skiprows=[2,5] 表示你在读取文件的时候会移除第 2 行和第 5 行。
最常用的功能:read_csv, read_excel
其他一些很棒的功能:read_clipboard, read_sql
2:pandas查看数据
- 计算基本的统计数据
data.describe()
- 打印出数据的前 3 行。
data.head(5)
- .tail() 对应的是数据的最后5行。
data.tail(5)
- 打印出第3行,索引为3 的所有数据
data.loc[3]
- 第四到第六行(左闭右开)的数据子集
data.loc[range(4,6)]
今天先学到这里,后续接着补充
一步一步提升,稳赢!!!
无论什么事情,只要投入足够有效的时间才能把它做好。
以上是关于python之panda模块2的主要内容,如果未能解决你的问题,请参考以下文章