pandas

Posted zsc329

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas相关的知识,希望对你有一定的参考价值。

pandas提供了

1.便于操作的数据类型

2.提供了很多分析函数和分析工具

import pandas as pd
d = pd.Series(range(20))
# print(d)
print(d.cumsum())

padas库的理解

两个数据类型:Series(一维),DataFrame(多维)

关注数据的应用表达,数据和索引之间的关系

 

series:理解为带标签数组

可以通过标量创建

s = pd.Series(5,index=[x,y,z])
print(s)

可以通过字典创建

s = pd.Series({x:1,y:2,z:3})
print(s)
s = pd.Series({x:1,y:2,z:3},index=[z,s,c,x,y])
print(s)

可以通过ndarrary创建

import pandas as pd
import numpy as np
b = pd.Series(np.arange(1,10))
print(b)
import pandas as pd
import numpy as np
b = pd.Series(np.arange(1,4),index=np.arange(9,4,-2))
print(b)

方法

.index   获得索引

.values 获得数据

import pandas as pd
import numpy as np
b = pd.Series(np.arange(1,4),index=np.arange(9,4,-2))
print(b.index)

由此可以得知Series类型就是index类型+ndarray类型

s = pd.Series({x:1,y:2,z:3},index=[z,s,c,x,y])
# print(s)
print(s[x])
print(s[0])  #此数可以得知数字索引是默认生产的
#两套索引可以并存但是不可以混用

可以使用ndarray的方法以及切片

s = pd.Series({x:1,y:2,z:3},index=[z,s,c,x,y])
print(s[s>s.median()])
print(np.exp(s))
print(s[:3])

可以使用字典中的in和.get方法

in判断的是:是不是索引的一部分

.get(a,b)若存在索引a返回值,不存在返回b

 

Series+Series:索引对应的值相加,索引自动对齐,如果索引只存在一个Series里相加得到的是NaN

a = pd.Series([1,2,3],[a,b,c])
b = pd.Series([4,5,6],[b,c,d])
c = a+b
print(c) 

#a    NaN
#b    6.0
#c    8.0
#d    NaN
#dtype: float64

属性:

a.name可以存贮在Series中

随时更改,即时生效

以上是关于pandas的主要内容,如果未能解决你的问题,请参考以下文章

text [检查特定的数据片段]取自论文但有意思应用。 #python #pandas

Python:用于元组的 Pandas DataFrame

pandas 求两个时间差, 转化秒,判断时间差是否大于阈值

将pandas列中的列表列表转换为字符串

微信小程序代码片段

VSCode自定义代码片段——CSS选择器