Pandas玩转数据
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas玩转数据相关的知识,希望对你有一定的参考价值。
Series的简单运算
import numpy as np import pandas as pd s1=pd.Series([1,2,3],index=[‘A‘,‘B‘,‘C‘]) print(s1)
结果:
A 1 B 2 C 3 dtype: int64
s2=pd.Series([4,5,6,7],index=[‘B‘,‘C‘,‘D‘,‘E‘]) print(s2)
结果:
B 4 C 5 D 6 E 7 dtype: int64
print(s1+s2)#对应的index相加,NaN与任何数相加都为NaN
结果:
A NaN B 6.0 C 8.0 D NaN E NaN dtype: float64
DataFrame的简单数学计算
df1=pd.DataFrame(np.arange(4).reshape(2,2),index=[‘A‘,‘B‘],columns=[‘BJ‘,‘SH‘]) df1
结果:
BJ | SH | |
---|---|---|
A | 0 | 1 |
B | 2 | 3 |
df2=pd.DataFrame(np.arange(9).reshape(3,3),index=[‘A‘,‘B‘,‘C‘],columns=[‘BJ‘,‘SH‘,‘GZ‘]) df2
结果:
BJ SH GZ A 0 1 2 B 3 4 5 C 6 7 8
df1+df2
结果:
BJ | GZ | SH | |
---|---|---|---|
A | 0.0 | NaN | 2.0 |
B | 5.0 | NaN | 7.0 |
C | NaN | NaN | NaN |
df3=pd.DataFrame([[1,2,3],[4,5,np.nan],[7,8,9]],index=[‘A‘,‘B‘,‘C‘],columns=[‘c1‘,‘c2‘,‘c3‘]) df3
结果:
c1 | c2 | c3 | |
---|---|---|---|
A | 1 | 2 | 3.0 |
B | 4 | 5 | NaN |
C | 7 | 8 | 9.0 |
df3.sum()#求每一列的和df3.sum(axis=0),为默认情况 #NaN与任何数相加都为NaN在这里不成立,会被忽略 df3.sum(axis=0)
结果:
c1 12.0 c2 15.0 c3 12.0 dtype: float64
df3.sum(axis=1)#求每一行的和
结果:
A 6.0 B 9.0 C 24.0 dtype: float64
df3.min()#求每一行的最小值 df3.min(axis=1)
结果:
A 1.0 B 4.0 C 7.0 dtype: float64
df3.min(axis=0)
结果:
c1 1.0 c2 2.0 c3 3.0 dtype: float64
df3.max()#用法同上 df3.max(axis=1)
结果:
A 3.0 B 5.0 C 9.0 dtype: float64
df3.max(axis=0)
结果:
df3.max(axis=0) df3.max(axis=0) c1 7.0 c2 8.0 c3 9.0 dtype: float64
print(df3) df3.describe()
结果:
c1 c2 c3 A 1 2 3.0 B 4 5 NaN C 7 8 9.0 c1 c2 c3 count 3.0 3.0 2.000000 mean 4.0 5.0 6.000000 std 3.0 3.0 4.242641 min 1.0 2.0 3.000000 25% 2.5 3.5 4.500000 50% 4.0 5.0 6.000000 75% 5.5 6.5 7.500000 max 7.0 8.0 9.000000
以上是关于Pandas玩转数据的主要内容,如果未能解决你的问题,请参考以下文章
Python自动化办公--Pandas玩转Excel数据分析