首页 > 解决方案 > 标记和复合词的向量表示

问题描述

我有一个句子语料库。它们中的每一个都可能包含标记的复合词。例如:

这是一个 example_sentence,后跟另一个 awesome_paragraph

. 我想获得所有标记和复合词的嵌入向量

(this, is, an, example, sentence, follow, by, another, awesome, paragraph, example_sentence, awesome_paragraph)

我可以用 gensim 或我应该使用哪个库来做到这一点吗?

标签: pythonmachine-learningword2vecgensimdoc2vec

解决方案


推荐阅读