python - 以 PEP8 方式检查 pandas 重复项
问题描述
我能想到的在 pandas 数据框中检查重复项的最简单方法如下:
if (df["col1"].value_counts() > 1).sum() > 0:
raise ValueError("dupes in column 'col1'!")
问题是这不符合 PEP8。我的 IDE(我使用 PyCharm)中的代码检查器告诉我:
类“bool”的未解析属性引用“sum”
在不添加多行代码的情况下,检查 pandas 重复项的可接受方法是什么?
解决方案
您的错误与 PEP8 无关。实际上,您的错误似乎是误报:您的 IDE 似乎在猜测比较操作的结果是布尔值,因此没有sum
orany
方法。
但是你的语法没有错:df["col1"].value_counts() > 1
返回一个布尔pd.Series
对象,它确实有sum
和any
方法。
我可以建议的唯一解决方案是使用另一个 IDE。或禁用您的代码检查器。
推荐阅读
- vue.js - Vuejs 3中的defineAsyncComponent
- node.js - 你可以在不修改 `package.json`、`yarn.lock` 或 `package-lock.json` 的情况下向 nodejs 应用程序添加依赖项吗?
- reactjs - React Hooks:带有依赖项的 useEffect 集呈现初始图像而不是设置图像
- rest - Google Fitness API 不征求同意
- php - 使用 Square API,我如何让我的订单出现在沙盒仪表板中?
- c# - 保持数据库历史更新
- visual-studio-2019 - IntelliSense 在大型 XAML 文件中不起作用
- r - 将宽数据集中的列转换为长数据集中的试验编号,该列是串联的问题名称字符串
- java - 在每一行上打印整个字符串的代码?
- ios - 使用后将每个单独的项目从数组中逐一删除?