首页 > 解决方案 > Pytorch 模型:不同机器上的推理结果截然不同?

问题描述

0.93我在 Pytorch 中训练了一个分割模型,并在我的本地计算机(Windows、conda、CUDA 10.2、Pytorch 1.2)上对其进行了测试以给出 F1 分数。0.3但是,在 Linux 服务器(conda、CUDA 9.0、Pytorch 1.1)上进行测试时,F1 分数下降了。我仔细检查了两组代码、标签文件、测试集是否相同,并且我的代码中没有“显式”随机抽样(即使是这样,效果也不应该那么剧烈)。

我尝试了以下方法来解决我的问题:

我怀疑它可能与 Pytorch 版本有关,所以在我的 Windows 机器上安装了 Pytorch 1.1 以匹配服务器,但得到了相同的0.93分数。然后我认为它与CUDA本身有关,因此完全消除了GPU因素并在服务器上对cpu进行了推理,我仍然0.3在服务器上。

什么可能导致这种巨大的差异?

标签: pythonpython-3.xpytorch

解决方案


推荐阅读