pandas
Posted zsc329
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas相关的知识,希望对你有一定的参考价值。
pandas提供了
1.便于操作的数据类型
2.提供了很多分析函数和分析工具
import pandas as pd d = pd.Series(range(20)) # print(d) print(d.cumsum())
padas库的理解
两个数据类型:Series(一维),DataFrame(多维)
关注数据的应用表达,数据和索引之间的关系
series:理解为带标签数组
可以通过标量创建
s = pd.Series(5,index=[‘x‘,‘y‘,‘z‘]) print(s)
可以通过字典创建
s = pd.Series({‘x‘:1,‘y‘:2,‘z‘:3}) print(s)
s = pd.Series({‘x‘:1,‘y‘:2,‘z‘:3},index=[‘z‘,‘s‘,‘c‘,‘x‘,‘y‘]) print(s)
可以通过ndarrary创建
import pandas as pd import numpy as np b = pd.Series(np.arange(1,10)) print(b)
import pandas as pd import numpy as np b = pd.Series(np.arange(1,4),index=np.arange(9,4,-2)) print(b)
方法
.index 获得索引
.values 获得数据
import pandas as pd import numpy as np b = pd.Series(np.arange(1,4),index=np.arange(9,4,-2)) print(b.index)
由此可以得知Series类型就是index类型+ndarray类型
s = pd.Series({‘x‘:1,‘y‘:2,‘z‘:3},index=[‘z‘,‘s‘,‘c‘,‘x‘,‘y‘]) # print(s) print(s[‘x‘]) print(s[0]) #此数可以得知数字索引是默认生产的 #两套索引可以并存但是不可以混用
可以使用ndarray的方法以及切片
s = pd.Series({‘x‘:1,‘y‘:2,‘z‘:3},index=[‘z‘,‘s‘,‘c‘,‘x‘,‘y‘]) print(s[s>s.median()]) print(np.exp(s))
print(s[:3])
可以使用字典中的in和.get方法
in判断的是:是不是索引的一部分
.get(a,b)若存在索引a返回值,不存在返回b
Series+Series:索引对应的值相加,索引自动对齐,如果索引只存在一个Series里相加得到的是NaN
a = pd.Series([1,2,3],[‘a‘,‘b‘,‘c‘]) b = pd.Series([4,5,6],[‘b‘,‘c‘,‘d‘]) c = a+b print(c) #a NaN #b 6.0 #c 8.0 #d NaN #dtype: float64
属性:
a.name可以存贮在Series中
随时更改,即时生效
以上是关于pandas的主要内容,如果未能解决你的问题,请参考以下文章
text [检查特定的数据片段]取自论文但有意思应用。 #python #pandas