apache-spark - 使用 Azure EventHub 进行 Spark 结构化流式处理
问题描述
在使用 Azure EventHub 进行 Spark Streaming 的上下文中,从技术上讲,我需要一些帮助来理解黑白 EventPosition.fromStartOfStream、EventPosition.fromEndOfStream 的区别。如果我每天只需要在启用检查点的情况下触发一次流式传输作业,那么下面的代码会有什么不同。
浏览了几个文档,找不到太多关于此的信息。任何帮助,将不胜感激。
val ehConf = EventHubsConf(cs).setStartingPositions(positions).setStartingPosition(EventPosition.fromStartOfStream)
val ehConf = EventHubsConf(cs).setStartingPositions(positions).setStartingPosition(EventPosition.fromEndOfStream)
解决方案
如果您正在检查点,那么 setStartingPosition 给出的位置将没有任何用处。它仅在没有找到检查点时使用。
推荐阅读
- docker - How to use docker container as host with ansible running in a docker container on gitlab-ci?
- c# - How do I prevent a SaveFileDialog from prompting twice to replace/overwrite a file?
- linux - 使用python将文本文件中的文件列表复制到文件夹
- gitlab - kiwi tcms - Gitlab bug tracker Integration
- java - 在单个 json POST 上保存父母和孩子
- angular - How to set HTTP Params in Angular without the key?
- jenkins - jenkins中用于多个邮件ID的邮件配置
- php - 显示帖子数
- java - How to write two return statements?
- android - Android Studio 上的错误:程序类型已存在:android.support.v4.content.AsyncTaskLoader