首页 > 解决方案 > 在 AllenNLP 包中保存/加载模型

问题描述

我正在尝试加载 AllenNLP 模型权重。我找不到任何关于如何保存/加载整个模型的文档,所以只能使用权重。

from allennlp.nn import util
model_state = torch.load(filename_model, map_location=util.device_mapping(-1))
model.load_state_dict(model_state)

我稍微修改了我的输入语料库,我猜正因为如此我得到语料库大小不匹配:

RuntimeError: Error(s) in loading state_dict for BasicTextFieldEmbedder:

    size mismatch for token_embedder_tokens.weight: 
    copying a param with shape torch.Size([2117, 16]) from checkpoint, 
    the shape in current model is torch.Size([2129, 16]).

似乎没有官方的方法可以用语料库词汇来保存模型。周围有什么黑客吗?

标签: pytorchallennlp

解决方案


AllenNLP 中有一个功能允许加载或保存模型。您是否按照AllenNLP 教程中列出的步骤进行操作?下面我粘贴了您可能感兴趣的教程片段:

# Here's how to save the model.
with open("/tmp/model.th", 'wb') as f:
    torch.save(model.state_dict(), f)

vocab.save_to_files("/tmp/vocabulary")

# And here's how to reload the model.
vocab2 = Vocabulary.from_files("/tmp/vocabulary")

model2 = LstmTagger(word_embeddings, lstm, vocab2)
with open("/tmp/model.th", 'rb') as f:
    model2.load_state_dict(torch.load(f))

如果上述方法对您不起作用,您可以检查allennlp.models.archival.archive_model辅助功能。使用此功能,您应该能够将模型的训练配置连同权重和词汇一起归档到 model.tar.gz。 Here您可以找到有关我讨论的两种方法的限制的更多信息


推荐阅读