word2vec - word2vec 模型可以用于单词也可以作为训练数据而不是句子
问题描述
在 Word2vec 中我们可以使用单词而不是句子进行模型训练吗
像下面的代码 gberg_sents 是句子标记模型 = Word2Vec(sentences=gberg_sents,size=64,sg=1,window=10,min_count=5,seed=42,workers=8)
像这样我们也可以使用单词标记吗
解决方案
不,word2vec 是用语言建模目标训练的,即它预测在其他单词周围出现的单词。为此,您的训练数据需要是显示单词在上下文中如何使用的实际句子。实际上,单词的上下文为您提供了嵌入中捕获的信息。
推荐阅读
- java - SimpleDateFormat 中月份的奇怪问题
- c - 比较 char* 行中的第一个字符?
- javascript - 如何覆盖 Angular 库 scss 变量?
- r - 使用 bin 标签 ggplot 创建彩虹直方图
- docker - 使用 docker 运行 gitlab-ci 时缓存 maven 依赖项
- google-sheets - 在其中一列是日期的 2 列上使用 Google Sheer 的过滤器选项?
- php - 使用 php 和 curl 上传插件 wordpress
- postgresql - Postgres 从多个 IOT 设备同步
- apache-kafka - 使用时间戳时 Kafka 代理中消息的持久性
- swiftui - iOS 14 vs 15 中的 SwiftUI LazyVGrid 单元格高度