pandas中na_values与keep_default_na

Posted ss-py

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas中na_values与keep_default_na相关的知识,希望对你有一定的参考价值。

我们在使用pandas读取文件时,常会遇到某个字段为NaN。

一般情况下,这时因为文件中包含空值导致的,因为pandas默认会将 

‘-1.#IND‘, ‘1.#QNAN‘, ‘1.#IND‘, ‘-1.#QNAN‘, ‘#N/A N/A‘,‘#N/A‘, ‘N/A‘, ‘NA‘, ‘#NA‘, ‘NULL‘, ‘NaN‘, ‘-NaN‘, ‘nan‘, ‘-nan‘, ‘‘
判定为缺失值,从而转换为NaN。
那么如何避免DATa Frame中出现NaN呢,使用keep_default_na参数可以解决。
keep_default_na参数用来控制是否要将被判定的缺失值转换为NaN这一过程,默认为True。,当keep_default_na=False时,源文件中出现的什么值,DataFrame中就是什么值。
 
 
下来再说na_values参数, 这个参数用来控制那些值会被判定为缺失值,它接收一个列表或者集合,当列表或者几个中出现的字符串在文件中出现时,它也会被判定为缺失值.
但是,无论此时keep_default_na=True还是False,他都将被改写。
技术图片

 

 

以上是关于pandas中na_values与keep_default_na的主要内容,如果未能解决你的问题,请参考以下文章

pandas read_excel,将单个标题读取到多列

处理 Pandas read_csv 中的缺失数据

使用read_fwf()读取pandas数据帧中的伪造数据

从 Google BigQuery 创建熊猫数据框时如何执行 na_values

Pandas之read_excel()和to_excel()函数解析

python pandas处理excel两列之和,碰到一个单元格为空就不求和了,怎么解决(详见截图)?