nlp - 在创建远程监督训练数据时,如果存在多个关系,如何确定两个实体之间的关系?
问题描述
我得到了远程监督的概念。至于我的理解,创建训练数据的过程是这样的;
- 从句子中提取命名实体
- 从每个句子中找到两个名为“e1”和“e2”的实体。
- 在知识库(freebase 等)中搜索这两个实体以查找它们之间的关系
我在这一步感到困惑。如果这两个实体(e1 和 e2)之间存在超过 1 个关系怎么办?如果是这样,我应该选择哪个关系?
解决方案
这取决于您正在训练的模型。
您是否正在学习一种关系的模型并进行引导?然后只关注那一种关系,并从您的数据库中删除其他关系。
你想学习一堆关系吗?然后使用每个存在或不存在作为模型中的特征。这就是Universals Schemas的工作方式。
这是来自 Universal Schema 论文的特征矩阵的图像:
推荐阅读
- css - 中心导航栏品牌和右拉“帮助”图标
- python - 如何打印特定级别的所有节点?
- reactjs - 如何在我的 JS 应用程序中为 Google Drive 文件夹创建搜索栏?
- javascript - 在 mousemove 函数上获取光标坐标的问题
- laravel - Laravel S3 文件上传 - PutObject 操作需要非空参数:Bucket
- django - Django - 异常值:if 标记中的表达式意外结束
- for-loop - 为什么我的 for 循环增加超过它应该停止的位置?
- javascript - 即使用户点击了他们的偏好并关闭了框,Cookie 通知也会继续打开
- haskell - Haskell堆栈安装包,但模块无法导入
- python - Python sounddevice 示例不发出任何声音(树莓派)