首页 > 解决方案 > 熊猫:如何使用熊猫从特定列合并数据框中的单元格?

问题描述

我想从单元格中删除重复的名称并将它们合并。此数据帧是在连接多个数据帧后生成的。

我的数据框如下:

|   | Customer ID | Category      | VALUE   |
| -:|:----------- |:------------- | -------:|
| 0 | GETO90      | Baby Sets     |  1090.0 |
| 1 | GETO90      | Girls Dresses |  5357.0 |
| 2 | GETO90      | Girls Jumpers |  2823.0 |
| 3 | SETO90      | Girls Top     |  3398.0 |
| 4 | SETO90      | Shorts        |  7590.0 |
| 5 | SETO90      | Shorts        |  7590.0 |
| 6 | RETO90      | Pants         |  6590.0 |
| 7 | RETO90      | Pants         |  6590.0 |
| 8 | RETO90      | Jeans         |  8590.0 |
| 9 | YETO90      | Jeans         |  9590.0 |
| 10| YETO90      | Jeans         |  2590.0 |

我想合并第一列,下面提到了预期的数据框:

|   | Customer ID | Category      | VALUE   |
| -:|:----------- |:------------- | -------:|
| 0 | GETO90      | Baby Sets     |  1090.0 |
| 1 |             | Girls Dresses |  5357.0 |
| 2 |             | Girls Jumpers |  2823.0 |
| 3 | SETO90      | Girls Top     |  3398.0 |
| 4 |             | Shorts        |  7590.0 |
| 5 |             | Shorts        |  7590.0 |
| 6 | RETO90      | Pants         |  6590.0 |
| 7 |             | Pants         |  6590.0 |
| 8 |             | Jeans         |  8590.0 |
| 9 | YETO90      | Jeans         |  9590.0 |
| 10|             | Jeans         |  2590.0 |

标签: python-3.xpandas

解决方案


duplicated与 一起使用loc

df.loc[df.duplicated('Customer ID'), 'Customer ID'] = ''

推荐阅读