apache-spark - Spark Streaming 延迟写入接收器
问题描述
我想在写入流式接收器(即 eventthub)之前引入 1 小时的延迟。如何做到这一点?我尝试了以下方法:
sinkOutput
.withColumn("Timestamp", current_timestamp())
.withWatermark("Timestamp", "60 minutes")
.trigger(Trigger.ProcessingTime("60 minutes"))
.format("org.apache.spark.sql.eventhubs.EventHubsSourceProvider")
.option("checkpointLocation", checkpointLocation)
.options(ehConf.toMap) // EventHubsConf containing the destination EventHub connection string.
.start()
但它似乎不起作用。有什么我想念的吗?
解决方案
推荐阅读
- javascript - React 中嵌套获取请求的问题
- botframework - 网络聊天:头像首字母和图像未显示
- ios - UINavigationBarAppearance 在 iOS 13 上的控制器上第一次没有布局
- java - 使用java在word文档中添加图像时无法读取输入文件
- python - 在条件中询问密钥是否存在以及在 python 中是否为真
- android - 如何在firebase实时数据库中删除child的特定孩子?
- node.js - 在 Angular NativeScript 中哪里可以找到 app.js 文件?
- php - -> 这在 php 中是什么意思?$blabla->blabla
- python - 如何从 pycharm python 脚本运行“pip install”?
- android - 在 ConstraintLayout 中滚动 RecyclerView 时如何折叠工具栏?