如何在python中同时使用applymap、lambda和dataframe来过滤/修改dataframe?

Posted

技术标签:

【中文标题】如何在python中同时使用applymap、lambda和dataframe来过滤/修改dataframe?【英文标题】:How to use applymap, lambda and dataframe together to filter / modify dataframe in python? 【发布时间】:2016-11-09 05:52:37 【问题描述】:

所以我想弄清楚如何在pd.DataFrame 中替换NaN ..? 在示例中,我创建了 3x3 数据框,其值为 df[1][2] = 'a',其余为 NaN

我的理解是我可以在lambda 中使用if 并在下面做一些事情。但结果出乎我的意料,它覆盖了'a'。我仍然希望'a' 保持原样,只更改为'o'NaN 在哪里...任何建议将不胜感激。

df = pd.DataFrame(index=range(0,3),columns=range(0,3))
df[1][2] = 'a'
f = lambda x: 'o' if np.nan else x
df.applymap(f)

【问题讨论】:

【参考方案1】:

您可以使用fillna,而不是使用apply

df.fillna('o')

有关Working with missing data的更多信息。您还可以将applypd.isnull() 一起使用,如@Psidom 回答中所述。但在这种情况下,你真的应该使用内置函数fillna

【讨论】:

【参考方案2】:

np.nan 并没有真正返回您期望的值,为了创建有效的谓词,您可以使用pd.isnull

df = pd.DataFrame(index=range(0,3),columns=range(0,3))
df[1][2] = 'a'
f = lambda x: 'o' if pd.isnull(x) else x
df.applymap(f)

#   0   1   2
#0  o   o   o
#1  o   o   o
#2  o   a   o

要了解它发生的原因,您可以将np.nan 转换为布尔值:

bool(np.nan)
# True

所以它总是返回真值,因此数据框中的所有值都将替换为o

【讨论】:

以上是关于如何在python中同时使用applymap、lambda和dataframe来过滤/修改dataframe?的主要内容,如果未能解决你的问题,请参考以下文章

python里的apply,applymap和map的区别

由于 ApplyMapping 不区分大小写,如何确定我需要哪些列?

pandas.DataFrame:如何使用外部参数 applymap()

如何在Python中删除重复的子字符串

proguard applymapping - mapping.txt 的更改不适用于下一个构建签名的 apk

pandas DataFrame applymap()函数