利用describe( )中的count来检查数据是否缺省
Posted 数据科学工作加油站
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用describe( )中的count来检查数据是否缺省相关的知识,希望对你有一定的参考价值。
1 #-*- coding: utf-8 -*- 2 #在python的pandas库中,只需要读入数据,然后使用describe()函数就可以查看数据的基本情况 3 import pandas as pd 4 inputDataSources = ‘../data/data.xls‘ 5 data = pd.read_excel(inputDataSources, index_col=u‘日期‘) #读取数据,指定‘日期’列为索引行 6 print data.describe() 7 print ‘数据源行数:‘,len(data)
output:
销量 count 200.000000 mean 2755.214700 std 751.029772 min 22.000000 25% 2451.975000 50% 2655.850000 75% 3026.125000 max 9106.440000 数据源行数: 201
其中count是指非空值数,通过len(data)可以得知数据记录是201行 ------->数据缺失值数为 1
25%、 50%、 75% 也就是 1/4、1/2、3/4分位数
以上是关于利用describe( )中的count来检查数据是否缺省的主要内容,如果未能解决你的问题,请参考以下文章
dataframe.describe() 抑制科学记数法[重复]