pandas - 如何根据 Pandas 中不同列中的重复值生成重复索引
问题描述
起始数据
我想生成一个递增索引,考虑到 ['name'] 列中的重复项。
name
vendor1
vendor2
vendor2
vendor3
vendor4
vendor4
vendor4
vendor4
期望的输出
id name
1 vendor1
2 vendor2
2 vendor2
3 vendor3
4 vendor4
4 vendor4
4 vendor4
4 vendor4
解决方案
使用factorize
列name
并分配给索引:
df.index = pd.factorize(df['name'])[0] + 1
推荐阅读
- python - 在 AWS Python lambda 函数中使用 http 下载太慢
- firebase - 在 Firebase 中保存时时间戳的值为空
- spring - 为什么 JPA Repository 总是创建一个事务?
- c++ - 共享指针的意外值
- macos - 无法在 Mac OS 上安装 Zim wiki
- amazon-web-services - Terraform 导入使用 terraform-aws-modules/security-group/aws//modules/web 创建的 aws 安全组资源
- python - 导入错误:导入熊猫时无法从输入中导入名称“IO”
- java - 如何导入 java.util.Scanner
- java - Anylogic 抢占块 如果其他资源池忙,则从资源池中抢占资源
- r - 在相同因子的 2 个值之间绘制垂直线