首页 > 解决方案 > 如何根据 Pandas 中不同列中的重复值生成重复索引

问题描述

起始数据

我想生成一个递增索引,考虑到 ['name'] 列中的重复项。

name
vendor1
vendor2
vendor2
vendor3
vendor4
vendor4
vendor4
vendor4

期望的输出

id    name
1     vendor1
2     vendor2
2     vendor2
3     vendor3
4     vendor4
4     vendor4
4     vendor4
4     vendor4

标签: pandasindexing

解决方案


使用factorizename并分配给索引:

df.index = pd.factorize(df['name'])[0] + 1

推荐阅读