apache-kafka - 重新平衡分区时 Apache Kafka 代理的 OOM
问题描述
我们有一个 Kafka 区域集群,包含 14 个代理(在 AWS 实例上)、53 个主题,每个主题 128 个分区。上次我们添加 3 个新代理时,在分区重新平衡期间,多个代理成为 OOM,不得不被强制终止。
卡夫卡版本是1.1.0
(2.11-1.1.0)。复制因子 3,日志保留 1 周。
内存堆大小设置为 8G。Box 有 244G 内存可用(d2.8xlarge
实例类型)。
Java内存配置:
-XX:+UseG1GC -XX:MaxGCPauseMillis=20 -XX:InitiatingHeapOccupancyPercent=35 -XX:+ExplicitGCInvokesConcurrent
-Xms8G -Xmx8G -XX:G1HeapRegionSize=16M -XX:MetaspaceSize=96m
-XX:MinMetaspaceFreeRatio=50 -XX:MaxMetaspaceFreeRatio=80
问题是:
- 什么可能导致OOM?
- 我们应该为 Kafka 代理分配多少内存,或者我们应该做些什么来避免 OOM?
谢谢!
解决方案
推荐阅读
- mysql - Laravel 7 - 需要构建查询字符串
- javascript - 如何从 page.on 函数中获取价值?
- firebase - 删除 Firestore 上的集合和子集合的最佳方法是什么?
- visual-studio-code - 以编程方式从 VSCode 扩展切换到 ActivityBar
- android - 可以在GDB+GdbServer的调试环境中使用调用函数命令吗?
- r - 使用 minfi 包加载 IDAT 数据时出错,n 参数无效,BiocParallel 错误
- android - 拖动项目时未调用 onTouch()
- php - 使用 html2canvas 捕获用 css 包裹在杯子周围的图像
- angular - 如何确保在路由更改后注入相同的 Angular Service 实例以使服务有状态?
- python-3.x - 运动检测器 GUI