pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值
Posted 追丰少年
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值相关的知识,希望对你有一定的参考价值。
在处理缺失值的时候,总会遇到各种问题
目录
5.删除指定某一列有nan,这样即可定位到所在行的index,然后对该index进行drop操作即可df[np.isnan(df[‘open’])].index #定位某一列是否有nan
直接drop对应indx即可删除该行df.drop(df[np.isnan(df[‘open’])].index, inplace=True)
6. df1 = df.dropna(axis=0, how=‘all’, subset=[‘d’, ‘c’]) #删除指定的两列都是空的行
import pandas as pd
data = pd.read_excel(r'测试数据.xlsx')
print(data)
先看看如下数据
1.删除全部为nan的行
import pandas as pd
data = pd.read_excel(r'测试数据.xlsx')
print(data)
# 删除表中全部为NaN的行
data = data.dropna(axis=0, how='all')
print(data)
输出:
2.删除含有nan的行
import pandas as pd
data = pd.read_excel(r'测试数据.xlsx')
print(data)
# 删除表中含有NaN的行
data = data.dropna(axis=0, how='any')
print(data)
输出:
3.删除全部为nan的列
# 删除全部为nan的列
data = data.dropna(axis=1, how='all')
数据如下:
输出:
4. 删除包含nan的列
# 删除包含nan的列
data = data.dropna(axis=1, how='any')
数据如下
输出:
5.删除指定某一列有nan,这样即可定位到所在行的index,然后对该index进行drop操作即可
df[np.isnan(df[‘open’])].index #定位某一列是否有nan
直接drop对应indx即可删除该行
df.drop(df[np.isnan(df[‘open’])].index, inplace=True)
数据如下:
输出:
6. df1 = df.dropna(axis=0, how=‘all’, subset=[‘d’, ‘c’]) #删除指定的两列都是空的行
7.筛选出nan的数据
df_nan = df[df['往来单位编号'].isna()]
8.筛选出非nan的数据
df_notnan = df[~df['往来单位编号'].isna()]
9.替换nan值
df.fillna('', inplace=True) # 将nan替换为'',否则无法保存到mysql
10.有时候是空字符串的情况
nan_df = df[(df['xxx'].str.len() <= 5) | (df['xxx'].isna())]
以上是关于pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值的主要内容,如果未能解决你的问题,请参考以下文章
EXCEL如何筛选出两组数据组合出现做多的,并统计出现频次?