spark-structured-streaming - 无法读取使用分区的 spark 结构化流创建的分区配置单元表
问题描述
interval2
.writeStream
.format("parquet")
.option("path","/user/usera/interval27e")
.partitionBy("year","month","day","mm")
.trigger(processingTime='15 seconds')
.option("checkpointLocation", "/user/usera/checkpoint27e")
.start()
我能够在 hdfs 中看到分区结构,但是当尝试读取配置单元表时得到空结果
解决方案
请您尝试使用以下代码:
val dataWrite = interval2
.writeStream
.format("parquet")
.partitionBy("year","month","day","mm")
.option("checkpointLocation", "/user/usera/checkpoint27e")
.outputMode(OutputMode.Append).trigger(Trigger.ProcessingTime("15 seconds"))
.start("/user/usera/interval27e")
dataWrite.processAllAvailable()
推荐阅读
- django - Django Rest Framework Post 嵌套模型
- cocoa - Why are my new subviews superposing in my splitview?
- java - 如何修复:嵌入式 H2 数据库“NonTransientError:无法读取该位置的页面”错误?
- python - 在一行中将元素追加并插入到列表中?
- javascript - 有什么方法可以在 ViewChildren 中获取 ElementRef 和 Component ref 吗?
- python-3.x - 使用 numpy 将二进制掩码应用于 RGB 图像的问题
- c# - Roslyn c# CSharpCompilation - 编译动态
- javascript - Reactjs中两个数字之间的百分比
- webstorm - WebStorm - JSX 格式化,自定义组件前换行
- c# - 这是在 WPF 中使用 Tasking & Dispatcher 的正确方法吗?