nlp - Chris Manning 很棒”,标签“PER PER O O”将变为 ([[1,9], [2,9], [3,8], [4,8]], [1, 1, 4, 4] ). "chris" 如何在 [1,9] 中编码?
问题描述
“克里斯”是如何在 [1,9] 中编码的?下面是代码链接
https://github.com/roypan/CS224n/blob/master/assignment3/q2_rnn.py
数据:是(句子,标签)元组的列表。@sentence 是包含句子中单词的列表,@label 是输出标签的列表。每个单词本身就是@n_features 特征的列表。例如,句子“Chris Manning is Amazing”和标签“PER PER O O”将变为 ([[1,9], [2,9], [3,8], [4,8]], [1, 1、4、4])。这里“Chris”这个词已经被特征化为“[1, 9]”,而“[1, 1, 4, 4]”是标签列表。
解决方案
通常,您通过访问查找表将单词转换为向量。每个单词都映射到一个不同的向量。这些向量是通过创建词嵌入的训练过程生成的。
GloVe 就是一个例子:
推荐阅读
- pip - 错误:不能回滚枕头;未卸载
- react-native - 构建 ios 时找不到“RNNRootViewProtocol.h”文件
- python - 获取列表事件时如何在 Python 中获取 Google Calendar API status_code?
- python - 为随机森林分类器运行任何 BayesSearchCV 函数时出错
- sql-server - 日期维度表中的智能日期键与日期数据类型
- typescript - 带有 Yarn、TypeScript 和 React Native 的 Lerna:找不到模块“@project/common”或其对应的类型声明。ts(2307)
- azure - 一些流在此命令完成之前终止!结构化流
- javascript - render_template 在接收到 ajax 内容(flask、python、javascript)后什么都不做
- google-cloud-platform - 更新 Deployment Manager 部署时如何在 VM 实例上执行命令行脚本
- azure-devops - Azure Pipeline 部署中的 Nuget 错误 NU1605 以供项目参考