首页 > 解决方案 > 将字典转换为 KeyedVectorFormat

问题描述

我尝试在这里使用代码: 将 Python 字典转换为 Word2Vec 对象

该错误没有意义。我以非二进制格式编写了文件,第一行应该是这样。
知道可能出了什么问题吗?或者另一种方式来达到相同的最终结果?

/usr/local/lib/python3.7/site-packages/gensim/models/keyedvectors.py in load_word2vec_format(cls, fname, fvocab, binary, encoding, unicode_errors, limit, datatype)
   1496         return _load_word2vec_format(
   1497             cls, fname, fvocab=fvocab, binary=binary, encoding=encoding, unicode_errors=unicode_errors,
-> 1498             limit=limit, datatype=datatype)
   1499 
   1500     def get_keras_embedding(self, train_embeddings=False):

/usr/local/lib/python3.7/site-packages/gensim/models/utils_any2vec.py in _load_word2vec_format(cls, fname, fvocab, binary, encoding, unicode_errors, limit, datatype)
    392                 parts = utils.to_unicode(line.rstrip(), encoding=encoding, errors=unicode_errors).split(" ")
    393                 if len(parts) != vector_size + 1:
--> 394                     raise ValueError("invalid vector on line %s (is this really the text format?)" % line_no)
    395                 word, weights = parts[0], [datatype(x) for x in parts[1:]]
    396                 add_word(word, weights)

ValueError: invalid vector on line 1 (is this really the text format?)

标签: word2vec

解决方案


推荐阅读