利用describe( )中的count来检查数据是否缺省

Posted 数据科学工作加油站

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用describe( )中的count来检查数据是否缺省相关的知识,希望对你有一定的参考价值。

1 #-*- coding: utf-8 -*-
2 #在python的pandas库中,只需要读入数据,然后使用describe()函数就可以查看数据的基本情况
3 import pandas as pd
4 inputDataSources = ../data/data.xls
5 data = pd.read_excel(inputDataSources, index_col=u日期) #读取数据,指定‘日期’列为索引行
6 print data.describe() 
7 print 数据源行数:,len(data)

output:

                销量
count   200.000000
mean   2755.214700
std     751.029772
min      22.000000
25%    2451.975000
50%    2655.850000
75%    3026.125000
max    9106.440000
数据源行数: 201

其中count是指非空值数,通过len(data)可以得知数据记录是201行 ------->数据缺失值数为 1

25%、 50%、 75% 也就是 1/4、1/2、3/4分位数

以上是关于利用describe( )中的count来检查数据是否缺省的主要内容,如果未能解决你的问题,请参考以下文章

LintCode刷题笔记-- Count1 binary

PowerBuilder -- 数据窗口

Redshift 中的模式匹配检查

dataframe.describe() 抑制科学记数法[重复]

hive中有数据 select count(*)显示为0的问题

检查数据框列中的所有值是不是相同