system - torch.save(predictions, predictions_path, pickle_module=dill) 系统死机
问题描述
我训练了整个网络并得到了参数。当我使用一个 pth 在测试数据集上推断结果时,只需通过调试进行测试,每次当它转到“torch.save(predictions,predictions_path,pickle_module=dill)”时,整个系统都会死机。时钟停止,鼠标无法移动。按 contl+alt+F1 到 tty 但没有响应。什么都做不了。一切都死了。如果我按“开始”按钮重新启动机器,系统就会说“丢失诱导文件”,整个系统都转储了,我必须重新安装整个 Linux。如果我等待死系统恢复,它会花费一天左右的时间,最后,它会恢复响应并只显示“系统错误”。
我搜索了所有可能的解决方案并尝试了但没有奏效。我购买了新的内存库,更新和升级了所有软件,检查了错误日志,并优化了许多系统服务。但一切都是徒劳的。每次它死了一天。该系统是 ubuntu 的 centos。任何人都可以帮忙吗?
解决方案
推荐阅读
- reactjs - RXJS 去抖动 ajax 调用
- javascript - Redux Thunk 和异步操作
- distributed-computing - Azure 机器学习工作区中的 Horovod 时间线和 MPI 跟踪(MPI 配置)
- javascript - 如何从 vue 中的 span html 中获取值?
- oracle - Oracle Forms 查询后 FRM-40735 和 ORA-01422
- python - 如何将颜色代码图例从对数刻度转换为实际值?
- elixir - 将纪元转换为人类可读的日期字符串,如何使我的代码更短?
- excel - 如何使用读取单元格并将其与图像文件名匹配的宏来更改 Excel 中的图像?
- c - AVL Tree单元测试,获取没有父节点的节点高度
- sql - 联合和右连接不适用于缺少的材料