performance - Kafka KStream 到 KStream 加入 | 重启性能
问题描述
我计划在很长一段时间内(约 1 周)将两个主题作为 KStreams 加入。假设这个窗口会累积上亿条记录,加入的消费者需要多长时间才能重启?我之所以问这个问题,是因为我无法找到有关该窗口中有多少记录存储在消费者缓存中的信息。
解决方案
默认情况下,缓存在窗口中的数据存储在 RocksDB 中,即本地磁盘中。因此,在重新启动时(在同一台机器上)不需要重新加载数据,因为数据已经可用。
如果您在另一台机器上重新启动,则需要从 Kafka 主题(备份存储以保证容错)重新读取存储的全部内容。这需要多长时间取决于许多因素,而且很难估计。您可以注册一个“恢复回调”来监控恢复过程。这应该为您提供一些方法来运行一些实验,以了解可能需要多长时间。
推荐阅读
- python - 如何从导入到组合框的 csv 文件中删除花括号?
- python - 持续时间以秒为单位的滑动窗口
- ios - Flutter IOS,CocoaPods 找不到 pod“Firebase/Analytics”的兼容版本
- javascript - 如何将此 .JS 函数复制到同一 Wix 页面上的多个元素?
- python - 为什么在 Python 中用参数调用这个“构造函数”?
- unit-testing - 如何在函数中将结构字段作为参数传递以显示 json 数据?
- python - 为模型训练和预测加密货币价格获取数据的问题
- wordpress - Wordpress - 从插件类中删除_action
- c++ - 如何通过 CMakeLists.txt 使当前项目中找到的不同目录项目包含目录?
- matlab - 值增加时更改绘图颜色