pytorch - 在 AllenNLP 包中保存/加载模型
问题描述
我正在尝试加载 AllenNLP 模型权重。我找不到任何关于如何保存/加载整个模型的文档,所以只能使用权重。
from allennlp.nn import util
model_state = torch.load(filename_model, map_location=util.device_mapping(-1))
model.load_state_dict(model_state)
我稍微修改了我的输入语料库,我猜正因为如此我得到语料库大小不匹配:
RuntimeError: Error(s) in loading state_dict for BasicTextFieldEmbedder:
size mismatch for token_embedder_tokens.weight:
copying a param with shape torch.Size([2117, 16]) from checkpoint,
the shape in current model is torch.Size([2129, 16]).
似乎没有官方的方法可以用语料库词汇来保存模型。周围有什么黑客吗?
解决方案
AllenNLP 中有一个功能允许加载或保存模型。您是否按照AllenNLP 教程中列出的步骤进行操作?下面我粘贴了您可能感兴趣的教程片段:
# Here's how to save the model.
with open("/tmp/model.th", 'wb') as f:
torch.save(model.state_dict(), f)
vocab.save_to_files("/tmp/vocabulary")
# And here's how to reload the model.
vocab2 = Vocabulary.from_files("/tmp/vocabulary")
model2 = LstmTagger(word_embeddings, lstm, vocab2)
with open("/tmp/model.th", 'rb') as f:
model2.load_state_dict(torch.load(f))
如果上述方法对您不起作用,您可以检查allennlp.models.archival.archive_model
辅助功能。使用此功能,您应该能够将模型的训练配置连同权重和词汇一起归档到 model.tar.gz。
Here
您可以找到有关我讨论的两种方法的限制的更多信息
推荐阅读
- node.js - 发生错误时如何使用 Sequelize ORM 作为 SHOW INDEX FROM `user_roles`
- java - org.apache.kafka.common.errors.TopicAuthorizationException:无权访问主题:
- python - 如何在python中的多个点拆分字符串
- mongodb - MongoDB 计算一组过滤文档集中每个值的出现次数
- ruby - Ruby 中的子类构造函数
- reactjs - 无法将我的 AWS api 网关与我的本地主机连接
- c - 确定块矩阵乘法的最佳块大小
- python-3.x - 错误:在使用 cdb 文件时,解包需要 8 个字节的缓冲区
- event-tracking - 如何跟踪我在 Facebook 上分享的网站上的文章?
- reactjs - 笑话:在 useEffect 中测试 React 状态变化