首页 > 解决方案 > Pyspark - 用前一个值和下一个值的平均值填充 nans

问题描述

我有一个数据集,其中所有列都是数字,并且有一些我想填写的 nan。这些行必须被视为一个时间序列,所以我想用下一个和上一个值的平均值填充这些 nan。有什么办法可以在 Pyspark 中做到这一点?

谢谢!!

标签: python-3.xpysparkpyspark-dataframes

解决方案


推荐阅读