首页 > 解决方案 > 如何在熊猫数据框中查找缺失的索引值?

问题描述

我的数据框是这样的。我知道我在数据清理中丢失了一些行,因为 len(df) 以前是 500,现在是 489。例如,我可以看到第 496 行丢失了。


    all       month day year
0   03/25/93    03  25  93
...
480     2013    1   1   2013
481     1974    1   1   1974
482     1990    1   1   1990
483     1995    1   1   1995
484     2004    1   1   2004
485     1987    1   1   1987
486     1973    1   1   1973
487     1992    1   1   1992
488     1977    1   1   1977
489     1985    1   1   1985
490     2007    1   1   2007
491     2009    1   1   2009
492     1986    1   1   1986
493     1978    1   1   1978
494     2002    1   1   2002
495     1979    1   1   1979
497     2008    1   1   2008
498     2005    1   1   2005
499     1980    1   1   1980

如何找出缺少哪些行?如果我的问题是重复的,请指出我的解决方案。谢谢!

标签: python-3.xpandasloopsindexingapply

解决方案


如果您有唯一的索引值,最简单的方法可能是使用索引上的差异,即您可以简单地执行以下操作:

df_original.index.difference(df_cleaned.index)

推荐阅读