首页 > 解决方案 > 在pyspark的任何列中删除具有特定值的行

问题描述

我在 pyspark 工作以清理数据集。数据集有“?” 在各个列中的各个行中。我想删除在其中任何位置具有值的任何行。我尝试了以下方法:

df = df.replace("?", "np.Nan") df=df.dropna()

但是,删除这些值不起作用。

我一直在网上寻找,但找不到任何可以理解的答案(我是新手)

标签: pyspark

解决方案


推荐阅读