apache-spark - Kafka 代理的 Spark 结构化流式更改 - 对检查点的影响
问题描述
我们有一个使用内部管理的 Kafka 在生产中运行的 spark 结构化流应用程序(让我们称之为kafka-inhouse
)
我们决定迁移到aiven kafka cloud
.
假设:
我们消费来自 的所有消息
kafka-inhouse
,然后将新消息发布到aiven kafka cloud
我们存储 Kafka 消息(使用 spark 流应用程序)的 S3 中的
path
和checkpoint
没有改变。
问题:
Spark 结构化流是否会无缝管理 Kafka 代理中的变化,尤其是在checkpointing
我们迁移之后?
解决方案
推荐阅读
- python - Django update_or_create(获取部分)使用相关对象作为kwarg
- bash - 通过 xargs 将 sed 输出传送到 grep 的问题
- java - 如何在不使用 byte[] 的情况下在 json 文件中编写多个二进制文件?
- arrays - 理解 compactMap 和 flatMap 的问题
- scala - System.loadLibrary(“libName”)上的“java.library.path 中没有 libName”
- visual-studio - Visual Studio 2019 版本。高 CPU 使用率
- node.js - Node.js + 卡夫卡 + AWS
- java - 无法识别的字段,未标记为可忽略
- ios - 设计导航项右栏按钮,在传递数据时与另一个 VC 连接
- prebid.js - 如何修复 Prebid server-java 包构建错误