Pandas 使用技巧(二)
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas 使用技巧(二)相关的知识,希望对你有一定的参考价值。
参考技术A由np.nan 填充丢失的数据
read 进来以后会自动加上索引
使用参数suffixes, 对于那些列名相同,但是又不在merge范围内的数据
其实还是使用 matplotlib 来画图的,但是可以集成到pandas的使用中去
首先是data.plot(),然后在调用plt.show() 将图片显示出来,这种方法对于Series和DataFrame都适用
画其他类型的图:
plot method:“bar”, “hist”, “box”, “area”
将两组数据画在同一张图上:重点在于指定ax
pandas和numpy使用
一、区别
Numpy:是数值计算的扩展包,它能高效处理N维数组,复杂函数,线性代数.
Panadas:是做数据处理。市python的一个数据分析包(panel datas)
二、使用方式
导入pandas和numpy模块:
import pandas as pd
import numpy as np
三、pandas常用数据类型(Series,DataFrame)
1.通过list创建Series,pandas会默认创建数字索引
list = [‘a‘,‘b‘,None,‘‘,1]
s = pd.Series(list)
2.通过传递一个numpyarray,时间索引以及列标签来创建一个DataFrame:
3.通过传递一个能够被转换成类似序列结构的字典对象来创建一个DataFrame:
通过字典创建dateframe时报错: If using all scalar(纯量,标量) values, you must pass an index,则需要为dataframe创建索引
4、查看不同列的数据类型:
df.dtypes
二、查看数据
1. 查看frame中头部和尾部的行:
df.head(arg) //查看从头部开始的几行
df.tail(arg) //查看从尾部开始的几行
2.显示索引、列和底层的numpy数据:
显示索引:df.index
显示列:df.coulmns
显示dataframe中的数据:df.values
3、 describe()函数对于数据的快速统计汇总:
4、 对数据的转置:df.T
5、 按轴进行排序:
6、 按值进行排序
df.sort(columns=‘arg‘)
三、选择
1、 选择一个单独的列,这将会返回一个Series,等同于df.A:
2、 通过[]进行选择,这将会对行进行切片:
以上是关于Pandas 使用技巧(二)的主要内容,如果未能解决你的问题,请参考以下文章