首页 > 解决方案 > AzureML:自动缩放 ML 端点

问题描述

我的模型托管在 ACI 计算上。我正在尝试调查支持基础实例的自动缩放需要什么?如果无法进行自动缩放,那么是否有文档可以手动缩放端点?

基本上,我需要在这个模型端点上支持高可用性。

我的一个想法是手动将模型发布到 2 个端点,然后在前面添加一个 Load Balander。似乎有点hacky...

谢谢!

标签: azure-machine-learning-service

解决方案



推荐阅读