首页 > 解决方案 > Kafka集群通过ansible重启

问题描述

重新启动属于集群的所有 kafka 服务器的建议方法是什么?

问题的本质是因为我们通过 管理它ansible,并且我们notify对例如 server.properties 进行了更改,因此重启将同时发生。

通常当经纪人消失时,数据会重新平衡,所以我想知道如果所有经纪人同时重新启动会发生什么。

标签: apache-kafkaansible

解决方案


以合理的方式重新启动应用程序是一个棘手的话题。要使其正常工作,您需要收集要求:

  • 更好的是 - 一次重新启动,可能不会重新启动(最多一次)或保证重新启动,可能多次重新启动(至少一次)
  • 如何检测节点是否可以重启?

根据第一个问题,您可能希望使用文件标志(在 /tmp 中)来指示重新启动处于挂起状态(如果 playbook 在中间失败,则将此标志用作应用程序重新启动的持久存储)。

对于第二个问题,最好的方法是查询 Ansible 之外的内容(例如一些 API 服务器、监控服务器等),以查看是否允许重新启动。

最安全和最慢的方法是serial: 1在重新启动节点之前运行重新启动剧本并进行多次检查。


推荐阅读