首页 > 解决方案 > 从检查点加载 BERT 时评估精度不同

问题描述

出于某种原因,当我在训练后立即评估我的 BERT 测试集与从保存的检查点加载时,我得到了截然不同的损失和 acc。我认为这可能是我对 BERT 的改编,所以我尝试尽可能少地修改 run_classifier.py 脚本以适应我的用例,但我仍然看到这个问题。

我能想到的唯一原因是模型没有正确加载,但我不知道如何修复它。我相信我正在加载最初的意图。对于 init_checkpoint 参数,我传递 path/to/classifier/model.ckpt-{last_step}。有三个模型文件(元、索引、数据),但也有检查点、事件和图形文件。我还需要对其他三个文件做些什么吗?我习惯使用 keras,这种纯粹的 tensorflow 保存/加载过程对我来说似乎是不必要的复杂化。

预先感谢您提供有关 BERT 或纯 tf 保存/加载的任何帮助/见解!如果你对 BERT 不熟悉,这里是 github 链接:BERT GitHub

标签: tensorflownlptensorflow-estimator

解决方案


推荐阅读