apache-spark - 如何避免附加在 spark df 中的反斜杠
问题描述
我创建了以下数据框,并在将其保存为 JSON 的同时,附加了反斜杠。如何避免?
df2=df1.withColumn("details",F.struct("id1","id2")).withColumn("result",F.struct("time","dist")).select("details", “结果”)
df3=df2.withColumn("step1",F.struct("details","result"))
df4= df3.withColumn("value",F.struct("step1"))
df5=df4.withColumn("type",F.lit("START")).select("values","value")
df5.write.format("json").mode("overwrite").option("delimiter",",").option("quote","").save("/home/usr/test1.json ")
#{"type":"start", "values":{"step1":{"details":{"id1":"es1","id2":"d455"},"result":{"time" :6785467578, "dist":7.95" }}}}
#输出:{ "type":"start", "values":{"step1":"{"details":"id1":"es1", "id2": "d455"},"result":{"时间":6785467578, "dist":7.95"}}"}}
解决方案
推荐阅读
- javascript - Angular 2+ 在 app.component.ts 方法中使用 jQuery 的附加选项
- python-3.x - 理解排序函数python的工作原理
- git - Windows 上的 Git text=auto core.autocrlf=false 提供 CRLF
- c++ - 使用 GDB 并检查 Data 的内存布局
- c# - 如何在返回类型为 Task 的方法中尝试捕获?
- python - python生成器比嵌套for循环快吗?
- sql-server - SQL Server:仅选择具有多列的记录的第一个实例
- java - 多个面板 - 如何将一个按钮从一个类链接到另一个类?
- r - 从日期画一个月
- angular - primeng p-datatable 保存过滤器标题值