missingno库—缺失值可视化

Posted 卖山楂啦prss

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了missingno库—缺失值可视化相关的知识,希望对你有一定的参考价值。

无解释说明,可百度~

data.info()
# 查看缺失情况
missing = data.isna().sum()
missing = pd.DataFrame(data={'特征': missing.index,'缺失值个数':missing.values})
#通过~取反,选取不包含数字0的行
missing = missing[~missing['缺失值个数'].isin([0])]
# 缺失比例
missing['缺失比例'] =  missing['缺失值个数']/data.shape[0]
# 排序
missing = missing.sort_values(by='缺失比例',ascending=False)
missing
sns.set(style="whitegrid", color_codes=True)
#sns.set(style='ticks')
fig = plt.figure(figsize=(20,10))
sns.barplot(np.arange(missing.shape[0]), list(missing['缺失比例'].values))
plt.title('Histogram of missing value of variables', fontsize=18)
plt.xlabel('variables names', fontsize=18)
plt.ylabel('missing rate', fontsize=18)
# 添加x轴标签,并旋转90度
plt.xticks(np.arange(missing.shape[0]),list(missing['特征']))
#plt.xticks(rotation=90)
# 添加数值显示
for x,y in enumerate(list(missing['缺失比例'].values)):
    plt.text(x,y+0.02,'{:.2%}'.format(y),ha='center',rotation=90,size=14)    
plt.ylim([0,1.05])
plt.xticks(fontsize=15)
plt.yticks(fontsize=15)
plt.show()


missingno库

安装

pip  install  -i  https://pypi.doubanio.com/simple/  --trusted-host pypi.doubanio.com  missingno
import missingno as msno
msno.matrix(data)

msno.bar(data, color=(0.25, 0.25, 0.25))

msno.dendrogram(data)

msno.heatmap(data)

以上是关于missingno库—缺失值可视化的主要内容,如果未能解决你的问题,请参考以下文章

数据缺失影响模型效果?是时候需要missingno工具包来帮你了!

超全超香,数据分析与数据挖掘最频繁使用代码合集来了

R语言ggplot2可视化:去除可视化结果中的NA图例删除缺失值图例

R语言ggplot2可视化:计算dataframe中每个数据列缺失值的个数使用堆叠的条形图(Stacked Barplot)可视化每个数据列的缺失值的情况(设置坐标轴为百分比以显示缺失值的比例)

可视化缺失值的办法——R语言

年鉴表格-数据可视化分析