如何在python中同时使用applymap、lambda和dataframe来过滤/修改dataframe?
Posted
技术标签:
【中文标题】如何在python中同时使用applymap、lambda和dataframe来过滤/修改dataframe?【英文标题】:How to use applymap, lambda and dataframe together to filter / modify dataframe in python? 【发布时间】:2016-11-09 05:52:37 【问题描述】:所以我想弄清楚如何在pd.DataFrame
中替换NaN
..?
在示例中,我创建了 3x3 数据框,其值为 df[1][2] = 'a'
,其余为 NaN
我的理解是我可以在lambda
中使用if
并在下面做一些事情。但结果出乎我的意料,它覆盖了'a'
。我仍然希望'a'
保持原样,只更改为'o'
,NaN
在哪里...任何建议将不胜感激。
df = pd.DataFrame(index=range(0,3),columns=range(0,3))
df[1][2] = 'a'
f = lambda x: 'o' if np.nan else x
df.applymap(f)
【问题讨论】:
【参考方案1】:您可以使用fillna
,而不是使用apply
。
df.fillna('o')
有关Working with missing data的更多信息。您还可以将apply
与pd.isnull()
一起使用,如@Psidom 回答中所述。但在这种情况下,你真的应该使用内置函数fillna
。
【讨论】:
【参考方案2】:np.nan
并没有真正返回您期望的值,为了创建有效的谓词,您可以使用pd.isnull
:
df = pd.DataFrame(index=range(0,3),columns=range(0,3))
df[1][2] = 'a'
f = lambda x: 'o' if pd.isnull(x) else x
df.applymap(f)
# 0 1 2
#0 o o o
#1 o o o
#2 o a o
要了解它发生的原因,您可以将np.nan
转换为布尔值:
bool(np.nan)
# True
所以它总是返回真值,因此数据框中的所有值都将替换为o
。
【讨论】:
以上是关于如何在python中同时使用applymap、lambda和dataframe来过滤/修改dataframe?的主要内容,如果未能解决你的问题,请参考以下文章
由于 ApplyMapping 不区分大小写,如何确定我需要哪些列?
pandas.DataFrame:如何使用外部参数 applymap()