word2vec - 不同语法的word2vec
问题描述
如果在不同的语言和不同的语法上实现 word2vec 的效果是什么?我的意思是 word2vec 是第一次在英语语料库上实现,如果我们使用另一种语言语料库有什么影响吗?
解决方案
Word2vec 已应用于多种语言 - 也作为语言到语言翻译策略的一部分,其中 word2vec 模型是在每种语言上分别学习的。
Word2vec 不依赖于英语语法的任何细节。相反,它只需要按自然顺序输入单词序列。
(在将单词序列传递给 word2vec 训练之前,没有清楚地指示单词的语言可能需要更复杂的标记化,但这超出了 word2vec 算法本身,一旦给定了正确的单词标记 word2vec 应该仍然能够学习具有通常理想排列的词向量。)
推荐阅读
- java - 清除画布并在其中再次绘制
- django - 当我尝试在邮递员上发布数据时,总是收到 {"detail":"Unsupported media type \"application/json\" in request."} 错误
- console - 如何在 Windows 上使用 MIDI-CSV 程序
- .net - .Net 应用程序中的本机依赖管理
- php - 如何将 guzzle 响应(来自图像 url)转换为 base64
- c# - 显示覆盖时如何禁用输入
- javascript - 将键和原型方法转换为驼峰式
- php - Laravel 5.8 Eloquent 无法按预期工作,尽管它的原始转储查询有效
- r - 我们如何编程 statet 以同时使用 knitr 和 pdflatex
- android - Firebase 功能集成问题