首页 > 解决方案 > 熊猫不掉线

问题描述

我正在尝试删除数据框中的所有重复项。

我在用着

removeDuplicates = data.drop_duplicates()

但它只是打印相同的数据集而不会删除重复项。

数据框示例:

在此处输入图像描述

应保留第一行,因此应删除第二次出现的 County 1 aka 副本。但是当我对此运行 drop duplicates 时没有任何反应

编辑:没关系,它正在打印不同的数据框。我误读了输出并使自己感到困惑。不应删除第二次出现的县 1,因为它不是重复项。

标签: pythonpandas

解决方案


您应该指定哪些列包含重复项:

removeDuplicates = data.drop_duplicates(subset=['COUNTY'])

推荐阅读