pyspark - 替换列表列pyspark中的null
问题描述
我有一个如下所示的数据框,并尝试使用 df.fillna(0) 或 df.fillna("nn") 替换 null,两者似乎都对数据框没有影响。任何建议将不胜感激。
id | value
+-----------+------------+
1 | ["a","b","c"]
6 | null
解决方案
您确定已将新数据框分配给旧数据框吗?因为它没有做到这一点。你应该做这个:
df = df.fillna(0)
df = df.fillna("nn")