mlflow - MLFlow 注册表高可用性
问题描述
我正在使用mlflow server
(https://mlflow.org/docs/latest/model-registry.html)运行 mlflow 注册表。服务器运行良好。如果服务器因任何原因崩溃,它会自动重新启动。但是在重新启动时服务器不可用。
是否可以在负载均衡器后面并行运行多个实例?这是安全的还是可能有任何不一致之处?
解决方案
是的,可以在负载均衡器后面运行多个 MLflow Tracker Service 实例。
因为跟踪服务器是无状态的,所以您可以将多个实例记录到复制的主数据库作为存储。如果主数据库发生故障,第二个热备用可以接管。
至于如何设置后端存储的复制实例的文档会因您选择使用哪个而有所不同,我们无法明确记录所有不同的场景及其配置。
我会检查后端数据库和负载均衡器的相应文档,了解如何将请求联合到 MLflow 跟踪服务器的多个实例、如何故障转移到热备用或复制数据库,或者如何配置热备用复制数据库实例。
短处:MLflow 跟踪服务器是无状态的。
推荐阅读
- angular - Angular:如何仅在应用程序内部返回
- node.js - 在 NodeJS 中解析 SQL 响应
- python - 从表单生成的 FLASK 表
- git - Git - 快进 1 或 N 次提交
- sql-server - transact-SQl 查询左连接两个表并从表中获取所有数据
- android - Expo 将 App 更新到 Play 商店 - 密钥错误
- jenkins - 在创建 URL 时转义空行
- python - 创建字符串 Python 的所有可能变体
- python - 如何从discord.py中的特定角色值中随机抽取
- java - 在 CPLEX for Java 中设置时间限制