python - Python - 基于最新迭代获取Datafame中每个变量的非NaN值
问题描述
如何根据其最新迭代选择每个变量,按 id 分组,非 NaN 值。我的数据框看起来像这样
唯一身份 | 迭代 | 变量_1 | 变量_2 |
---|---|---|---|
111 | 1 | 苹果 | 钠 |
111 | 2 | 钠 | 桌子 |
111 | 3 | 橙 | 钠 |
111 | 4 | 梨 | 钠 |
111 | 5 | 钠 | 椅子 |
预期的结果应该是
唯一身份 | 迭代 | 变量_1 | 变量_2 |
---|---|---|---|
111 | 5 | 梨 | 椅子 |
还假设会有很多unique_id
解决方案
您可以使用:
df.fillna(method="ffill")
用于在重新索引的 Series pad / ffill中填充孔的方法:向前传播最后一个有效观察。
之后,您可以反转排序并删除重复项,基本上每个“组”仅获得 1 个条目:
df = df.sort_values(["unique_id", "iteration"], ascending=False)
df = df.drop_duplicates(["unique_id", "iteration"])
推荐阅读
- amazon-web-services - AWS Api Gateway JWT 授权 - 获取“签名方法 HS256 无效”错误
- c++ - 如何在 C++ 上比较两个数组上的元素
- javascript - 转换持续时间没有正确应用 VanillaJS
- javascript - 将默认值复制到剪贴板
- django - 如何将 Django 的 update_or_create 函数用于具有多个字段的模型?
- android - 为 Jetpack Compose 中的文本指定最少行数
- python - 神经网络反向传播代码不起作用
- javascript - 使用 Promise 更改 Javascript 类
- javascript - Vue 错误没有意义:执行调度程序刷新期间出现未处理的错误。onVnodeUnmounted=fn
参考=参考<空>> - django - Django抽象基类中的自动递增非主键字段