如何在熊猫数据框中查找缺失的索引值?

Posted

技术标签:

【中文标题】如何在熊猫数据框中查找缺失的索引值?【英文标题】:How to find missing index values in a pandas dataframe? 【发布时间】:2020-12-03 07:07:55 【问题描述】:

我的数据框是这样的。我知道我在数据清理中丢失了一些行,因为 len(df) 以前是 500,现在是 489。 例如,我可以看到缺少第 496 行。


    all       month day year
0   03/25/93    03  25  93
...
480     2013    1   1   2013
481     1974    1   1   1974
482     1990    1   1   1990
483     1995    1   1   1995
484     2004    1   1   2004
485     1987    1   1   1987
486     1973    1   1   1973
487     1992    1   1   1992
488     1977    1   1   1977
489     1985    1   1   1985
490     2007    1   1   2007
491     2009    1   1   2009
492     1986    1   1   1986
493     1978    1   1   1978
494     2002    1   1   2002
495     1979    1   1   1979
497     2008    1   1   2008
498     2005    1   1   2005
499     1980    1   1   1980

如何找出丢失的行? 如果我的问题是重复的,请指出我的解决方案。谢谢!

【问题讨论】:

【参考方案1】:

如果您有唯一的索引值,最简单的方法可能是使用索引上的差异,即您可以简单地这样做:

df_original.index.difference(df_cleaned.index)

【讨论】:

以上是关于如何在熊猫数据框中查找缺失的索引值?的主要内容,如果未能解决你的问题,请参考以下文章

如何合并熊猫中的重复行?

如何使用熊猫从另一个数据框中的一个数据框中查找值?

根据索引在熊猫数据框中查找特定列的值[重复]

如何计算熊猫数据框中每一列的唯一性?

如何在熊猫数据框中插入列名? [复制]

查找熊猫索引数据帧的最小值和最大值