python - Pytorch 模型：不同机器上的推理结果截然不同？

问题描述

0.93我在 Pytorch 中训练了一个分割模型，并在我的本地计算机（Windows、conda、CUDA 10.2、Pytorch 1.2）上对其进行了测试以给出 F1 分数。0.3但是，在 Linux 服务器（conda、CUDA 9.0、Pytorch 1.1）上进行测试时，F1 分数下降了。我仔细检查了两组代码、标签文件、测试集是否相同，并且我的代码中没有“显式”随机抽样（即使是这样，效果也不应该那么剧烈）。

我尝试了以下方法来解决我的问题：

我怀疑它可能与 Pytorch 版本有关，所以在我的 Windows 机器上安装了 Pytorch 1.1 以匹配服务器，但得到了相同的0.93分数。然后我认为它与CUDA本身有关，因此完全消除了GPU因素并在服务器上对cpu进行了推理，我仍然0.3在服务器上。

什么可能导致这种巨大的差异？

标签： pythonpython-3.xpytorch

python - Pytorch 模型：不同机器上的推理结果截然不同？

问题描述

解决方案

推荐阅读