首页 > 解决方案 > AWS ECS 任务错误 -- 可用的 GPU 资源不足

问题描述

当我发布具有具有下一个 GPU 要求的任务(期望计数 1)的服务时,我在 AWS ECS 集群(启动类型为 EC2)上收到以下错误:

    "resourceRequirements": [
            {
              "type":"GPU",
              "value": "1"
            }
    ]

错误消息: 服务 XXXXXXX 无法放置任务,因为没有容器实例满足其所有要求。最接近的匹配容器实例 YYYYYYYYY 没有足够的可用 GPU 资源。

附加到集群的 EC2 实例是 p2.8xlarge,有 8 个 GPU,应该可以满足我的要求。

欢迎任何有关 ECS 如何计算这些要求的帮助或信息。

谢谢

标签: amazon-web-servicesgpuamazon-ecs

解决方案


推荐阅读