ray - 在多个 AWS 账户之间设置集群
问题描述
我想设置一个 Ray 集群以在 AWS 上使用 Rtune over 4 gpus。但是每个 gpu 都属于我们团队的不同成员。我已经搜索了可用资源以寻求答案,但一无所获。帮助 ?
解决方案
为了使用跨多个 AWS 账户的实例启动 Ray 集群,您需要确保 AWS 实例可以通过相关端口相互通信。为此,您需要修改实例的 AWS 安全组(但请确保不要向全世界开放端口)。
--redis-port
您可以通过参数、--redis-shard-ports
、--object-manager-port
和--node-manager-port
toray start
在头节点和 just--object-manager-port
和--node-manager-port
非头节点上选择需要哪些端口。请参阅相关文档。
但是,您尝试做的事情听起来有些复杂。如果可能的话,使用单个帐户会容易得多,在这种情况下,您可以使用Ray autoscaler。
推荐阅读
- ios - 尝试更改 UIImageView 的框架,但根据代码它不起作用
- ios - 将原始 PCM 音频流式传输到 iPhone 扬声器输出的最简单方法
- angular - angular+oidc-client:getUser() 总是返回 null
- php - 虚拟主机在 ubuntu LAMP 堆栈中无法正常工作
- node.js - module.exports 找不到模块
- javascript - pdf.js 的问题不下载文件和打印
- reactjs - 无法在其他表单域上输入
- java - Spring boot security Authentication [This localhost page can't be found: HTTP ERROR 404] 错误
- reactjs - 如何修复 React:字符串与预期的模式错误不匹配
- angular - Angular TestBed.inject