首页 > 解决方案 > 如何用 Apache Spark 数据框中的前一个或下一个值替换 None 或 null?

问题描述

如何通过 pandas DataFrame 中的前一个或下一个值替换 NaN?

有没有办法用上面同一列中的第一个非空值替换每个无、空值或空值?如果您有如下数据框:

    0   1   2
0   1   2   3
1   4  None None
2 None None 9

变成:

   0  1  2
0  1  2  3
1  4  2  3
2  4  2  9

Spark 有pyspark.sql.DataFrame.fillna但像 (method='ffill') 这样的选项不可用。

标签: apache-sparkfillna

解决方案


推荐阅读