tensorflow - 从检查点加载 BERT 时评估精度不同
问题描述
出于某种原因,当我在训练后立即评估我的 BERT 测试集与从保存的检查点加载时,我得到了截然不同的损失和 acc。我认为这可能是我对 BERT 的改编,所以我尝试尽可能少地修改 run_classifier.py 脚本以适应我的用例,但我仍然看到这个问题。
我能想到的唯一原因是模型没有正确加载,但我不知道如何修复它。我相信我正在加载最初的意图。对于 init_checkpoint 参数,我传递 path/to/classifier/model.ckpt-{last_step}。有三个模型文件(元、索引、数据),但也有检查点、事件和图形文件。我还需要对其他三个文件做些什么吗?我习惯使用 keras,这种纯粹的 tensorflow 保存/加载过程对我来说似乎是不必要的复杂化。
预先感谢您提供有关 BERT 或纯 tf 保存/加载的任何帮助/见解!如果你对 BERT 不熟悉,这里是 github 链接:BERT GitHub
解决方案
推荐阅读
- azure-data-factory - ADF 数据流 - 用下划线替换列名中的空格
- java - 如何在 JPA 中使用 ZeroOrOneToOne 反向引用映射 OneToOne?
- javascript - 从 JavaScript 文件中导出函数
- reactjs - 在 useEffect 中访问 Formik 的 setValues
- python - 不断将渲染的 Matplotlib 训练指标图更新到我的显示器
- r - R中的Loc函数?
- awk - AWK 过滤然后修剪输出
- angular - 访问 Angular 中动态生成的材料表中的列
- azure - 如何使用 Powershell 从 Azure Functions 获取 Azure Blob Uri?
- reactjs - 从 auth0 收到令牌后如何在 react.js 中调用/检索 getTokenSilent