首页 > 解决方案 > 如何使用 scala 从数据框创建 XML 字符串

问题描述

我有一个场景,我正在从我的配置单元表中读取并创建一个 spark 数据框。我想从数据帧的输出中生成一个 xml 字符串并将其保存在一个新的数据帧中(作为 xml 字符串),而不是将其写入 HDFS 中的文件以创建 xml。请告诉我这是否可以使用 databricks spark-xml 来完成。

标签: xmlscaladatabricksapache-spark-xml

解决方案


您不能使用 spark-xml 库执行此操作,但您可以重用其中的写出部分来为 XmlRdd 创建您自己的解决方案:https ://github.com/databricks/spark-xml/blob/master/src/主/scala/com/databricks/spark/xml/util/XmlFile.scala

你可以在第 80 行找到这个。


推荐阅读