Pandas 使用技巧(二)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas 使用技巧(二)相关的知识,希望对你有一定的参考价值。

参考技术A

由np.nan 填充丢失的数据

read 进来以后会自动加上索引

使用参数suffixes, 对于那些列名相同,但是又不在merge范围内的数据

其实还是使用 matplotlib 来画图的,但是可以集成到pandas的使用中去

首先是data.plot(),然后在调用plt.show() 将图片显示出来,这种方法对于Series和DataFrame都适用

画其他类型的图:
plot method:“bar”, “hist”, “box”, “area”

将两组数据画在同一张图上:重点在于指定ax

pandas和numpy使用

一、区别
Numpy:是数值计算的扩展包,它能高效处理N维数组,复杂函数,线性代数.

Panadas:是做数据处理。市python的一个数据分析包(panel datas)

二、使用方式

导入pandas和numpy模块:

import pandas as pd

import numpy as np

三、pandas常用数据类型(Series,DataFrame)

1.通过list创建Series,pandas会默认创建数字索引

list = [‘a‘,‘b‘,None,‘‘,1]

s = pd.Series(list)

技术图片

 

 2.通过传递一个numpyarray,时间索引以及列标签来创建一个DataFrame:

技术图片

 

 3.通过传递一个能够被转换成类似序列结构的字典对象来创建一个DataFrame:

通过字典创建dateframe时报错: If using all scalar(纯量,标量) values, you must pass an index,则需要为dataframe创建索引

技术图片

 

 4、查看不同列的数据类型:

df.dtypes

技术图片

 

 二、查看数据

1. 查看frame中头部和尾部的行:

df.head(arg) //查看从头部开始的几行

df.tail(arg) //查看从尾部开始的几行

 2.显示索引、列和底层的numpy数据:

显示索引:df.index

显示列:df.coulmns

显示dataframe中的数据:df.values

3、 describe()函数对于数据的快速统计汇总:

4、 对数据的转置:df.T

5、 按轴进行排序:

技术图片

 

6、 按值进行排序

df.sort(columns=‘arg‘)

三、选择

1、 选择一个单独的列,这将会返回一个Series,等同于df.A:

技术图片

 

 2、 通过[]进行选择,这将会对行进行切片:

技术图片

 

以上是关于Pandas 使用技巧(二)的主要内容,如果未能解决你的问题,请参考以下文章

pandas和numpy使用

python pandas 使用

pandas介绍以及数据清洗使用

python之pandas模块的基本使用

python中pandas库的使用

Pandas 数据处理入门教程合集