首页 > 解决方案 > Word2Vec + Regression - 数值评分方法

问题描述

我想建立一个神经网络,以词组和数值作为输入,数值作为输出。

为此,我认为最合适的解决方案是在词组上使用 Word2Vec 算法以获得嵌入,然后用它们和其他输入/输出训练神经网络(可能是 LSTM 网络)。

但是如何实现呢?由于每个单词都有一个权重向量(感谢 Word2Vec 算法),如何训练神经网络来预测数值(换句话说,回归)?或者至少,我怎样才能将这个权重向量转换为有意义的数值?(我实际上不知道如何用数值向量和“简单”数值一起训练神经网络。)

我试图在网上检查这些概念,但我没有找到与我的目的非常相关的文章。他们之中有一些是:

- 带有逻辑回归的词嵌入

- https://machinelearningmastery.com/use-word-embedding-layers-deep-learning-keras

- https://pdfs.semanticscholar.org/8eb6/74c76fc471e9cf815921b6329eb4a1bbed30.pdf

标签: pythontensorflowmachine-learningneural-networkword2vec

解决方案


通常你会使用像余弦相似度这样的距离算法来计算向量之间的距离。距离越短,你的词就越相似。


推荐阅读