首页 > 解决方案 > 删除仅出现在 Spark 数据帧中每列末尾的反斜杠“\”?

问题描述

我有一个火花数据框。我只需要从数据框中删除每列末尾的反斜杠“\”。

我尝试了以下代码,但它替换了数据框中的所有“\”。

val df2 = df.columns.foldLeft(df)((df, c) => df.withColumn(c, regexp_replace(col(c), "\\\\", "")))

但我需要删除每列末尾的反斜杠。

样本输入行:

349272|SET\CURVE\|SHE\HE|MBHG\

预期输出行:

349272|设置\曲线|她\他|MBHG

提前致谢。

标签: regexscalaapache-sparkapache-spark-sql

解决方案


推荐阅读