将整个数据帧转换为小写并删除 nan,python 3.6

Posted

技术标签:

【中文标题】将整个数据帧转换为小写并删除 nan,python 3.6【英文标题】:Convert entire data frame lower case & remove nan, python 3.6 【发布时间】:2018-02-28 08:21:17 【问题描述】:

我尝试使用以下脚本将整个数据框转换为小写。但是空白会用nan填充,我试图删除nan但没有用。

data = data.apply(lambda x: x.astype(str).str.lower())
data = data.replace(np.nan, '', regex=True)

如何解决?

【问题讨论】:

如果你制作regex=False,这应该可以工作 可能重复***.com/questions/39512002/… @Zero,出现填空nan的问题,所以我在新线程中询问 @faithon.gvr.py Q1+Q2 仍然是重复的。这两个问题已经作为单独的问题得到了回答。请参阅 NaN ***.com/questions/26837998/… @Zero,好的。我同意... 【参考方案1】:

您已接近 - 首先是 fillna,然后是 astype,最后转换为 lowercase

data = data.fillna('').astype(str).apply(lambda x: x.str.lower())

【讨论】:

以上是关于将整个数据帧转换为小写并删除 nan,python 3.6的主要内容,如果未能解决你的问题,请参考以下文章

Scala Spark 在数据帧和数据集中以不同方式处理 Double.NaN

python 将csv文件转换为Pandas数据帧并遍历其行的函数

Databricks:如何将 %python 下的 Spark 数据帧转换为 %r 下的数据帧

使用 Pandas 将整个数据帧从小写转换为大写

根据 NaN 值将数据帧拆分为多个数据帧

如何将数据读取到 dask 数据帧并删除坏行