如何获取Pandas DataFrame中的最大值/最小值
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何获取Pandas DataFrame中的最大值/最小值相关的知识,希望对你有一定的参考价值。
由于我的pandas数据帧的一列有nan
值,所以当我想获得该列的最大值时,它只返回错误。
>>> df.iloc[:, 1].max()
'error:512'
如何跳过nan
值并获取该列的最大值?
答案
你可以使用NumPy
对np.nanmax
,np.nanmin
的帮助:
In [28]: df
Out[28]:
A B C
0 7 NaN 8
1 3 3 5
2 8 1 7
3 3 0 3
4 8 2 7
In [29]: np.nanmax(df.iloc[:, 1].values)
Out[29]: 3.0
In [30]: np.nanmin(df.iloc[:, 1].values)
Out[30]: 0.0
另一答案
你可以使用Series.dropna。
res = df.iloc[:, 1].dropna().max()
另一答案
当df包含NaN
值时,它会报告NaN
值,使用np.nanmax(df.values)
给出了所需的答案。
另一答案
Dataframe聚合函数.agg()
将自动忽略NaN值。 df.agg({'income':'max'})
此外,它也可以与.groupby
一起使用
df.groupby('column').agg({'income':['max','mean']})
另一答案
如果你不使用iloc或loc,它很简单:
df['column'].max()
要么
df['column'][df.index.min():df.index.max()]
或者在第二个方括号中的任何范围
以上是关于如何获取Pandas DataFrame中的最大值/最小值的主要内容,如果未能解决你的问题,请参考以下文章
pandas获取dataframe中索引值最大值所在的数据行(get dataframe row of max index value)
如何从 Pandas DataFrame 中的路径获取基本文件名
pandas使用idxmax函数获取dataframe每个数据行中最大值对应的列名称(column label of max value in each row in dataframe)