python-3.x - 熊猫:如何使用熊猫从特定列合并数据框中的单元格?
问题描述
我想从单元格中删除重复的名称并将它们合并。此数据帧是在连接多个数据帧后生成的。
我的数据框如下:
| | Customer ID | Category | VALUE |
| -:|:----------- |:------------- | -------:|
| 0 | GETO90 | Baby Sets | 1090.0 |
| 1 | GETO90 | Girls Dresses | 5357.0 |
| 2 | GETO90 | Girls Jumpers | 2823.0 |
| 3 | SETO90 | Girls Top | 3398.0 |
| 4 | SETO90 | Shorts | 7590.0 |
| 5 | SETO90 | Shorts | 7590.0 |
| 6 | RETO90 | Pants | 6590.0 |
| 7 | RETO90 | Pants | 6590.0 |
| 8 | RETO90 | Jeans | 8590.0 |
| 9 | YETO90 | Jeans | 9590.0 |
| 10| YETO90 | Jeans | 2590.0 |
我想合并第一列,下面提到了预期的数据框:
| | Customer ID | Category | VALUE |
| -:|:----------- |:------------- | -------:|
| 0 | GETO90 | Baby Sets | 1090.0 |
| 1 | | Girls Dresses | 5357.0 |
| 2 | | Girls Jumpers | 2823.0 |
| 3 | SETO90 | Girls Top | 3398.0 |
| 4 | | Shorts | 7590.0 |
| 5 | | Shorts | 7590.0 |
| 6 | RETO90 | Pants | 6590.0 |
| 7 | | Pants | 6590.0 |
| 8 | | Jeans | 8590.0 |
| 9 | YETO90 | Jeans | 9590.0 |
| 10| | Jeans | 2590.0 |
解决方案
duplicated
与 一起使用loc
:
df.loc[df.duplicated('Customer ID'), 'Customer ID'] = ''
推荐阅读
- filtering - 最新日期的 Talend 过滤器行
- grafana - 如何在 Fluentd 匹配标签 loki 中评估表达式
- next.js - 带有 nextjs 的 SSG 会导致大量获取 404 的 json 文件
- reference - 标题引用静态而不是在更改顺序时更改
- python - python中未腌制集中的意外性能下降
- java - 如何修复 java.sql.SQLException:找不到适用于 JDBC:ODBC:Driver 的驱动程序
- git - 如何一劳永逸地从我的仓库中删除 git-lfs
- spring-boot - 卡夫卡消费者卡在重新平衡状态
- javascript - 主页中的应用程序状态会不断重新渲染,直到应用程序崩溃?
- postgresql - 在 PostgreSQL 中为每个 ID 添加日期