google-ai-platform - 自动缩放 VertexAI 管道组件
问题描述
我正在探索 VertexAI 管道,并了解它是 AI Platform 管道(您必须部署 GKE 集群才能运行 Kubeflow 管道)的托管替代方案。我不清楚的是 VertexAI 是否会根据负载自动缩放集群。在对类似问题的回答中,提到对于使用 GCP 资源(如 Dataflow 等)的管道步骤,将自动完成自动缩放。在google docs中,提到对于组件,可以设置资源,例如 CPU_LIMIT GPU_LIMIT 等。我的问题是,是否可以为任何类型的组件(即 Google Cloud 管道组件或自定义组件)设置这些限制,无论是基于 Python 函数还是那些打包为容器映像的组件?其次,这些限制是否意味着组件资源将自动缩放直到达到这些限制?如果甚至没有指定这些选项会发生什么,那么资源是如何分配的,它们会按照 VertexAI 认为合适的方式自动缩放吗?
相关文档和资源的链接将非常有帮助。
解决方案
为了回答您的问题,
1. 可以为任何类型的组件设置这些限制吗?
是的。因为,这些限制适用于所有 Kubeflow 组件,并不特定于任何特定类型的组件。可以实现这些组件以使用一定数量的资源执行任务。
2. 这些限制是否意味着组件资源会自动缩放直到达到限制?
不,Vertex AI 不执行自动缩放。根据设置的限制,Vertex AI 选择一个合适的 VM 来执行任务。Google Cloud Pipeline Components 支持拥有工作人员池,例如“<a href="https://google-cloud-pipeline-components.readthedocs.io/en/google-cloud-pipeline-components-0.1.4/ google_cloud_pipeline_components.aiplatform.html#google_cloud_pipeline_components.aiplatform.CustomContainerTrainingJobRunOp" rel="nofollow noreferrer">CustomContainerTrainingJobRunOp" 和 "<a href="https://google-cloud-pipeline-components.readthedocs.io/en/google-cloud- pipeline-components-0.1.4/google_cloud_pipeline_components.aiplatform.html#google_cloud_pipeline_components.aiplatform.CustomPythonPackageTrainingJobRunOp" rel="nofollow noreferrer"> CustomPythonPackageTrainingJobRunOp”作为 Vertex AI 中分布式训练的一部分。否则,每个步骤只使用 1 台机器。
3. 如果没有指定这些限制会怎样?Vertex AI 是否会按其认为合适的方式扩展资源?
如果未指定限制,则“<a href="https://cloud.google.com/compute/docs/general-purpose-machines#e2_machine_types" rel="nofollow noreferrer">e2-standard-4” VM用于任务执行作为默认选项。
编辑:我已经用最新版本的文档更新了链接。
推荐阅读
- laravel - 如何在 VestaCP 的单个项目中启用让我们为多个域加密 SSL?
- android - 是否可以在 Android 中使用 .mlmodel 并使用 Playground(Xcode)进行训练?
- math - 回归输出 - 是否可以仅使用系数及其 p 值计算系数的标准误差?
- firebase - Cloud Functions 模拟器中未显示写入 Cloud Firestore(模拟器)
- python - TypeError:__init__() 在 Python 中为 CatBoost 获得了一个意外的关键字参数“early_stopping_rounds”
- authentication - 如何在 Groovy/Grails 上实现社交网络登录?
- powershell - 用于将多行文本提取到单行的 Powershell 脚本
- c# - 使用 google vision OCR API 从特定图像位置提取数据
- tcl - 按预定义列表中的值对 TCL 列表进行排序
- pdf - PDF Stream 中的 Post Scripts 命令将如何绘制?