python - 考虑到使用 pandas 的 NaN 值,如何获取每列的最新值
问题描述
我有以下数据框
| Name | Year | COL1 | COL2 | COL3 |
------------------------------------------------
0 | A | 1980 | NaN | NaN | 9817 |
1 | A | 1981 | NaN | 1610 | 11487 |
2 | A | 1982 | 22.74 | NaN | 12256 |
3 | A | 1983 | 15.50 | NaN | 14214 |
4 | B | 1980 | NaN | 1580 | NaN |
5 | B | 1981 | 13.50 | 1603 | NaN |
6 | B | 1982 | 17.00 | 1610 | NaN |
7 | B | 1983 | 19.30 | NaN | NaN |
8 | C | 1980 | 12.00 | NaN | 1750 |
9 | C | 1981 | 15.50 | 1997 | 1790 |
10| C | 1982 | 16.36 | 2027 | 1790 |
11| C | 1983 | 22.74 | NaN | 1810 |
我需要得到上面数据框的以下数据。该数据是每个考虑列
的最新 ( ) 数据,并且by year
Name
COL1
COl2
COL3
Name | COL1 | COL2 | COL3 |
------------------------------------------------
A | 15.50 | 1610 | 14214 |
B | 19.30 | 1610 | NaN |
C | 22.74 | 2027 | 1810 |
解决方案
用于GroupBy.last
每组的最后一个非缺失值:
#if necessary
#df = df.sort_values(['Name','Year'])
df = df.groupby('Name', as_index=False).last()
推荐阅读
- r - 逐行while循环数据帧?
- heroku - 从手机应用程序向 nightscout 发送数据时出现问题
- python - 如何在 Tensorflow-keras 中为 nlp 使用预测?
- python - 如何像在 keras 中一样编写自己的“功能 API”?
- python - 如何使用高度倾斜的数据 -pandas 数据框
- javascript - 有没有办法在外部访问异步函数内部的“fileSize”变量?
- java - 在运行时未找到 Gradle 本地依赖项
- python - 如何在 Pyomo 中调用 Python 函数
- php - 是否有一个函数可以获取特定数字的 N 个最接近的数字?
- python - 更改 Keras 模型变量