首页 > 解决方案 > 如何使用 word2vec 嵌入将文本转换为向量?

问题描述

假设我有一个如下所示的数据框:

|正文

| RI 的风暴比上次飓风还要严重

|芝加哥绿线脱轨

|MEG 发布危险天气展望

我使用以下代码创建了 word2vec 模型:

def sent_to_words(sentences):
    for sentence in sentences:
        yield(gensim.utils.simple_preprocess(str(sentence), deacc=True))

text_data = sent_to_words(df['Text'])
w2v_model = gensim.models.Word2Vec(text_data, size=100, min_count=1, window=5, iter=50)

现在我将如何使用这个 word2vec 模型将“文本”列中的文本转换为向量?

标签: python-3.xmachine-learningnlpword2vecword-embedding

解决方案


您可以通过以下方式获得生成的词嵌入

w2v_model.wv

您可以通过以下方式获取特定单词的单词嵌入

w2v_model.wv['word']

推荐阅读