Pandas-数据探索

Posted 守墨岭

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas-数据探索相关的知识,希望对你有一定的参考价值。

Pandas包对数据的常用探索功能,方便了解数据描述性属性。

Pandas数据格式

  • Series
  • DataFrame:每个column就是一个Series

基础属性

  • shape
    • 返回行列数
  • index
  • columns
  • values
  • dtype/dtypes

 

基础方法

  • unique()
    • 返回唯一值的数组
  • isnull()
    • notnull():isnull()的否定式
    • df.isnull()
      s.isnull() s.isnull().value_counts()
  • isin()
    • 1 # 返回布尔值
      2 s.isin([1,2,3])
      3 df["A"].isin([1,2,3])

       

统计方法

  • count()
  • value_counts()
    • 统计Series各值数量  
    • # 默认 sort = True
      s.value_counts()
      pd.value_counts(s,sort=False)
  • describe() 
    • df.describe()
       
       ABCD
      count 6.000000 6.000000 6.000000 6.000000
      mean -0.465925 -0.146798 0.005445 -0.756245
      std 0.841877 0.238644 1.389317 1.471563
      min -1.587605 -0.456638 -2.072448 -2.840490
      25% -0.786075 -0.306717 -0.649605 -1.528442
      50% -0.729990 -0.144521 -0.021415 -0.816773
      75% 0.090604 0.035111 0.848559 0.157414
      max 0.692672 0.130688 1.868398 1.220088

以上是关于Pandas-数据探索的主要内容,如果未能解决你的问题,请参考以下文章

D-Tale,实现 Pandas GUI 高效数据探索分析

Pandas-数据探索

Pandas数据探索分析,分享两个神器

pandas 中的多变量(2d)探索

使用 Pandas GUI 进行数据探索

推荐 2个十分好用的 pandas 数据探索分析神器!