python - 熊猫不掉线
问题描述
我正在尝试删除数据框中的所有重复项。
我在用着
removeDuplicates = data.drop_duplicates()
但它只是打印相同的数据集而不会删除重复项。
数据框示例:
应保留第一行,因此应删除第二次出现的 County 1 aka 副本。但是当我对此运行 drop duplicates 时没有任何反应
编辑:没关系,它正在打印不同的数据框。我误读了输出并使自己感到困惑。不应删除第二次出现的县 1,因为它不是重复项。
解决方案
您应该指定哪些列包含重复项:
removeDuplicates = data.drop_duplicates(subset=['COUNTY'])
推荐阅读
- jenkins - 如何在阶段并行运行期间获得失败的阶段名称?
- android - 具有两个生成字段的实时数据库查询
- jenkins - 在 jenkinsfile 或管道中找不到 def 命令
- python - 如何计算高分辨率图像之间的匹配特征?
- android - Android listview 不能用 android 中的 getFilter() 更新
- coq - Proof. 是什么意思?简单。反身性。Qed。在 Coq 中是什么意思?
- excel - 从另一个工作簿调用命名工作表(在 Visual Basic 中)
- reactjs - React TypeScript - Chartjs Annotations - Bar Annotation 未正确显示
- emacs - 如何在 spacemacs 中为“evil-escape-key-sequence”分配多个组合键?
- javascript - 异步承诺执行器函数