python - Word2Vec + Regression - 数值评分方法
问题描述
我想建立一个神经网络,以词组和数值作为输入,数值作为输出。
为此,我认为最合适的解决方案是在词组上使用 Word2Vec 算法以获得嵌入,然后用它们和其他输入/输出训练神经网络(可能是 LSTM 网络)。
但是如何实现呢?由于每个单词都有一个权重向量(感谢 Word2Vec 算法),如何训练神经网络来预测数值(换句话说,回归)?或者至少,我怎样才能将这个权重向量转换为有意义的数值?(我实际上不知道如何用数值向量和“简单”数值一起训练神经网络。)
我试图在网上检查这些概念,但我没有找到与我的目的非常相关的文章。他们之中有一些是:
- 带有逻辑回归的词嵌入
- https://machinelearningmastery.com/use-word-embedding-layers-deep-learning-keras
- https://pdfs.semanticscholar.org/8eb6/74c76fc471e9cf815921b6329eb4a1bbed30.pdf
解决方案
通常你会使用像余弦相似度这样的距离算法来计算向量之间的距离。距离越短,你的词就越相似。
推荐阅读
- javascript - 页面可以在 iPhone 中向下拖动 - Framework7 Cordova
- php - 500 从查询中获取大量记录时发生内部错误
- python - 想要运行只打印一次 else 语句的 PRAW 机器人
- python - 为什么我需要 web api 来链接 django 和其他 js 框架
- django - Wagtail 博客示例导致没有属性“_default_manager”
- c++ - 如何设置 CMakeLists.txt 以正确导入 AntTweakBar 库?
- python - how module/function is imported and how to know which keywords can be passed to built-in functions
- ios - Build IOS in flutter it's showing GeneratedPluginRegistrant.m Plugin headers not found ex :(#import
) - c++ - How to integrate windows/Internet explorer's internet properties options and proxy?
- javascript - How to fix eslint prefer-destructuring if we want to override defined variable?