nlp - 将 word2vec 字典加载到 gensim
问题描述
我已经将预训练的 word2vec 嵌入加载到表单的 python 字典中
{word: vector}
例如,该词典的一个元素是
w2v_dict["house"] = [1.1,2.0, ... , 0.2]
我想将此模型加载到 Gensim(或类似的库)中,以便我可以找到嵌入之间的欧几里德距离。
我知道预训练的嵌入通常出现在一个可以加载到 Gensim 中的 .bin 文件中。但是,如果我只有这种形式的字典,我将如何将向量加载到模型中?
解决方案
您可以将其保存为 gensim word2vec 格式,然后在此处gensim.models.KeyedVectors.load_word2vec_format
使用.Details加载它。
推荐阅读
- python - 如何控制 matplotlib.pyplot.imshow 中像素的颜色?
- python - 保存文件时,我的写入参数的 TypeError 必须是字符串
- reporting-services - SSRS 2019 自定义 CSS
- django - 无法在 django 视图中从 POST 检索数据
- javascript - 未知的自定义元素:
- 您是否正确注册了组件? - tableau-api - Tableau Server 不会加载
- javascript - Chrome 开发片段:javascript 平滑滚动缓动
- java - 在 Mockito 中,有什么方法可以模拟具有需要模拟的方法和需要测试的方法的类(而不是接口)?
- openai-gym - 改变网格中周期性出现的对象的速度
- docker - 创建的 Docker 容器进程未列出