google-cloud-platform - GCP - GPU 暂存时间减少
问题描述
我有一个应用程序需要尽可能短的启动时间/TTL,并将 GPU 连接到 GCP CE 中的 VM。为了降低成本,我的基础架构依赖于在需求增加/减少时启动和停止实例。
我在没有 GPU 的情况下使用自定义图像实现了不到 5 秒的启动时间,但是一旦我连接了 GPU,“运行”的时间总是超过 20-30 秒。
我尝试了多个不同的发行版,清除 linux,预打包的 Nvidia 驱动程序映像,Fedora 的最小安装,Debian 的最小化,内核和用户空间的减少 - systemd-analyze 说我的启动时间是 3 秒,但使用 GPU 启动 VM 需要 20-跑步前的“STAGING”30 秒。
这只发生在 gpu 连接到 VM 并且移除 VM 在 systemd-analyze 提到的时间内启动时。它在所有发行版和引导映像中都是一致的。
我是否缺少任何软件包或文档来加快连接 GPU 的暂存时间,或者这是 GCP 内部 GPU 实例暂存的限制?
我非常感谢任何帮助或建议。
如果您也遇到此问题并想跟踪其进度,我创建了一个问题报告: https ://issuetracker.google.com/issues/200575905
解决方案
推荐阅读
- javascript - 如果 JSON 数据包含未定义,则附加不同的变量
- python - BeautifulSoup 网页抓取:UnboundLocalError:分配前引用的局部变量“汤”
- jenkins - 如何在 Jenkins 流水线构建后阶段运行脚本
- excel - VBA Range("A1048576").End(xlUp).Row in Javascript Excel API
- docker-compose - 在 WSL2 上使用 Docker 容器的提琴手
- python - 如何在 Python 中使用 bs4 从 html 中刮取这个值
- python - 如何使用单元格中的指定日期遍历行?
- python - 使用 PATCH API 调用更新现有数据
- c++ - start=i,end=j; 有什么区别?和开始=我;结束=j;
- websocket - 使用 websocket 的 Gatsby 生产构建警告