首页 > 解决方案 > Python gensim 从向量创建 word2vec 模型(在 ndarray 中)

问题描述

我有一个带有单词及其对应向量的 ndarray(每个单词的大小为 100)。例如:

Computer 0.11 0.41 ... 0.56
Ball     0.31 0.87 ... 0.32

等等。

我想从中创建一个 word2vec 模型:

model = load_from_ndarray(arr)

怎么做到呢?我看见

键控向量

但它只需要文件而不是数组

标签: pythonnlpgensimword2vec

解决方案


from gensim.models import KeyedVectors
words = myarray[:,0]
vectors = myarray[:,1:]
model = KeyedVectors(vectors.shape[1])
model.add(words, vectors)

如果你愿意,你可以保存它

model.save('mymodel')

然后加载它

model = KeyedVectors.load('mymodel')

推荐阅读