首页 > 解决方案 > word2vec 模型可以用于单词也可以作为训练数据而不是句子

问题描述

在 Word2vec 中我们可以使用单词而不是句子进行模型训练吗

像下面的代码 gberg_sents 是句子标记模型 = Word2Vec(sentences=gberg_sents,size=64,sg=1,window=10,min_count=5,seed=42,workers=8)

像这样我们也可以使用单词标记吗

标签: word2vecnatural-language-processing

解决方案


不,word2vec 是用语言建模目标训练的,即它预测在其他单词周围出现的单词。为此,您的训练数据需要是显示单词在上下文中如何使用的实际句子。实际上,单词的上下文为您提供了嵌入中捕获的信息。


推荐阅读