slurm - SLURM - 连接 slurm 流套接字时出错 - 连接被拒绝
问题描述
我正在尝试仅使用一名工人配置 slurm。这是配置:
ControlMachine=slurmserver ----> hostname -s
ControlAddr=A.B.C.D ----> hostname -i
NodeName=worker-[1-1] CPUs=1 State=UNKNOWN
PartitionName=debug Nodes=worker-[1-1] Default=YES MaxTime=INFINITE State=UP
在slurmserver
节点上,我尝试从 jupyterhub 容器中提交slurm
作业(一个简单的)。srun echo "Hello"
从slurmd
我看到的日志中:
[2021-07-01T10:51:49.138] [59.0] debug2: Error connecting slurm stream socket at 172.17.6.75:34027: Connection refused
[2021-07-01T10:51:49.139] [59.0] debug: _send_srun_resp_msg: 5/5 failed to send msg type 6002: Connection refused
[2021-07-01T10:51:49.139] [59.0] error: _send_launch_resp: Failed to send RESPONSE_LAUNCH_TASKS: Connection refused
我也试过打开 32768-60999 端口,但还是不行。
有什么建议吗?
解决方案
推荐阅读
- java - 不能在 java 注释中使用 html 标签吗?
- gcloud - Google Cloud ML:重复“尝试刷新以获取初始 access_token”,然后“作业失败”
- powershell - powershell-script 从 EventLog 读取登录和注销
- powershell - 在大文件的尾部之前附加文本
- amazon-s3 - 当我们使用 parition by 创建随机样本时,CTAS 如何在 s3 中创建文件?
- java - 从返回的字符串中删除括号
- visual-studio - Visual Studio 2019 调试 wcf 服务在 Windows 托盘图标中加载 WcfSvcHost.exe 非常慢
- apache-spark - 在 spark 数据框中连续应用更改
- r - R-Shiny 错误:“renderDataTable”和“server=FALSE”
- amazon-web-services - 使用 Amazon ECS 运行 Docker 网络