python-3.x - 如何在python中删除重复的“id”列值
问题描述
我有几个数据框,我想合并到一个大数据框来构建分类器。
在此数据框中,有 id 列指示客户端 ID。我有像这样的其他数据框,其中包含与 user_id 列相关的列。
因此,目标是将这些小数据帧合并到 user_df_copy 中,添加诸如 subject_id 之类的列,并且仅当 user_id 与主 df id 匹配时才具有值,否则为 NaN。问题是,在这些小数据帧中,id 出现重复。
我还像这样将 get_dummies 应用于 subject_id 列。
解决方案
If you want to just drop duplicate rows in the smaller DataFrame
s you can use:
df.drop_duplicates(subset="id")
推荐阅读
- javascript - 拖放图像和 CSS
- lua - 获取表中表的值
- git - 如何在 git commit 中打印更改的行?
- javascript - React 中的模板字符串
- angular - Angular 库编译时错误“违反不变量:没有格式路径或格式”
- javascript - 我无法从 facebook api 图形工具获取短用户令牌
- typescript - TypeScript - 限制元组泛型的类型保存映射类型
- coq - 无法找到 Coq 库:`错误:无法找到库浮点数。`
- docker - 在不是应用程序的谷歌云中运行 docker 容器
- git - Jenkins 和 gitlab 多分支 pupeline