首页 > 解决方案 > 将 word2vec 字典加载到 gensim

问题描述

我已经将预训练的 word2vec 嵌入加载到表单的 python 字典中

{word: vector}

例如,该词典的一个元素是

w2v_dict["house"] = [1.1,2.0, ... , 0.2]

我想将此模型加载到 Gensim(或类似的库)中,以便我可以找到嵌入之间的欧几里德距离。

我知道预训练的嵌入通常出现在一个可以加载到 Gensim 中的 .bin 文件中。但是,如果我只有这种形式的字典,我将如何将向量加载到模型中?

标签: nlpgensimword2vecspacyword-embedding

解决方案


您可以将其保存为 gensim word2vec 格式,然后在此处gensim.models.KeyedVectors.load_word2vec_format使用.Details加载它。


推荐阅读