apache-spark - 火花结构化流式镶木地板覆盖
问题描述
我希望能够用镶木地板格式覆盖我的输出路径,但它不在可用操作中(追加、完成、更新),这里还有其他解决方案吗?
val streamDF = sparkSession.readStream.schema(schema).option("header","true").parquet(rawData)
val query = streamDF.writeStream.outputMode("overwrite").format("parquet").option("checkpointLocation",checkpoint).start(target)
query.awaitTermination()
解决方案
Apache Spark 仅Append
支持File Sink
. 在这里查看
file system
在写入数据之前,您需要编写代码来删除路径/文件夹/文件。
查看此 stackoverflow 链接以获取ForeachWriter
. 这将帮助您实现您的案例。
推荐阅读
- node.js - Hyperledger Fabric Node.js 链码:错误:无法解析来自的引用对象
- c++ - 想要在结构中嵌入一个 const char *const 模板参数,以用作另一个函数中的模板参数
- assembly - 无法运行汇编 exe 文件
- python - 何时在 Django 模型中使用 __str___ 方法?
- php - PHP 错误:SMTP 错误:无法验证
- python - Python 3.7,按下按钮时更改按钮的颜色
- python - pyodbc - 传递参数
- javascript - Apollo 从缓存中查询对象值
- swift - 更改 AudioQueueBuffer 的 mAudioData
- laravel - 创建令牌的 laravel 气闸问题:'tokenable_id' 不能为空