首页 > 解决方案 > MLFlow 注册表高可用性

问题描述

我正在使用mlflow serverhttps://mlflow.org/docs/latest/model-registry.html)运行 mlflow 注册表。服务器运行良好。如果服务器因任何原因崩溃,它会自动重新启动。但是在重新启动时服务器不可用。

是否可以在负载均衡器后面并行运行多个实例?这是安全的还是可能有任何不一致之处?

标签: mlflowmlmodel

解决方案


是的,可以在负载均衡器后面运行多个 MLflow Tracker Service 实例。

因为跟踪服务器是无状态的,所以您可以将多个实例记录到复制的主数据库作为存储。如果主数据库发生故障,第二个热备用可以接管。

至于如何设置后端存储的复制实例的文档会因您选择使用哪个而有所不同,我们无法明确记录所有不同的场景及其配置。

我会检查后端数据库和负载均衡器的相应文档,了解如何将请求联合到 MLflow 跟踪服务器的多个实例、如何故障转移到热备用或复制数据库,或者如何配置热备用复制数据库实例。

短处:MLflow 跟踪服务器是无状态的。


推荐阅读