stanford-nlp - 如何从头开始在 gensim 中训练 Glove 嵌入?
问题描述
如何从头开始在 gensim 中训练 Glove 嵌入?我可以为此使用 gensim 吗?
解决方案
Gensim 没有实现 GLoVe 算法。但它确实提供了非常相似的 word2vec 算法,该算法还为单个单词创建了一个“密集嵌入”(即具有许多不同非零值的高维向量)。看:
https://radimrehurek.com/gensim/models/word2vec.html
而且,对于某些语言和目的,FastText 算法可以根据这些单词中的子字符串为以前从未见过的单词提供比随机更好的猜测向量:
https://radimrehurek.com/gensim/models/fasttext.html
Gensim 的KeyedVectors
类还可以加载在其他地方训练的 GLoVe 向量集,用于将这些向量应用于其他任务:
from gensim.models import KeyedVectors
glove_kv = KeyedVectors.load_word2vec_format(GLOVE_FILE, binary=False, no_header=True)
print(glove_kv['apple'])
推荐阅读
- c++ - c++ 矢量仅在 64 版本中崩溃 - SIGBUS
- ios - 在应用程序中添加 Fabric 时,链接器命令失败,退出代码为 1(使用 -v 查看调用)
- reactjs - Material-UI TexField Select - 展开时显示不同
- excel - 在目录的 Excel 中提供文件列表会减慢 excel
- php - mpdf 在 cli 中有效,但在浏览器中无效
- python - 字典键字符串
- java - Project Reactor:我需要处理器吗?
- javascript - 在节点中使用 Arguments 对象时,箭头函数中的行为不正确
- blender - 如何在 Blender 中将对象的每个断裂导出到单独的 .obj 文件中?
- laravel - 恢复链接到另一个类别 Laravel 的类别的 slug