python - 在 pandas DF 中查找和替换重复值
问题描述
我在熊猫中有以下df:
我需要找到重复值,在这种情况下,索引 2 中的数字 1 并应用公式 ma.trunc(ma.pow(x,2))+1 并在替换索引 2 中的值结果之后数字1 是。
任何帮助将不胜感激。
解决方案
您可以使用duplicated()命令找到所有重复项。请注意,keep="first"(默认值)将防止第一次出现被标记为重复。
is_dup = df.duplicated(subset="Enrollment", keep="first")
然后,您可以将自定义函数应用于与where()和map()函数重复的值。
my_func = lambda x: ma.trunc(ma.pow(x,2))+1
df["Enrollment"] = df["Enrollment"].where( ~is_dup, df["Enrollment"].map( my_func ))
推荐阅读
- amazon-web-services - 删除 S3 存储桶的 Web 面板访问权限
- reactjs - Next.js API 应用程序 :: TypeError: 无法读取未定义的属性“地图”
- stored-procedures - 在 Synapse 中动态创建外部表
- solidity - 如何可靠地从我的合约中提取所有代币
- python - Hugginface NER 管道是否在内部处理长文档?
- jenkins - 可以从 Jenkins 共享管道库生成 json 文件,然后在 Active Choices Reactive Parameter groovy 脚本中使用它吗?
- python - 有没有比使用 .apply 和 str.contains 更快的方法来搜索数据框的每一列以查找字符串?
- azure-devops - 删除 Workitem Azure devops 中的注释
- wordpress - 添加尾部斜杠 htacess 多次重定向
- php - 如何一次开发多个 Composer 包?