nlp - 我应该使用 NLP 来检测元数据中的实体吗?如何?
问题描述
我有一些关于建筑物的元数据,这里是一个例子:
AHU-S-6F-01.RA.CO2.1
我正在寻找一种方法让计算机能够识别元数据中的实体,例如:
[Location].[Sensor-Type].[Sensor-Element].[Sensor-ID]
数据集中还有其他数据格式,所以我想我可以使用命名实体识别 (NER) 并由 Tensorflow.js 实现,以使计算机学会识别元数据中的实体并给它们打上标签。我在下面找到了一个例子:
https://monkeylearn.com/text-analysis/
命名实体识别 (NER) 是否适合用于检测元数据中的实体?如何通过 Tensorflow.js 实现它?
如果没有,我应该用什么来解决这个问题?
谢谢!!!
解决方案
如果您的信息是完全可预测的(确定性的),每个字段都是预期的并且每个值都是预定义的,我会选择正则表达式。
NLP/NER 技术需要一些训练(成百上千个训练示例),如果值随时间变化,您必须使用新示例重新训练。它可以处理出现歧义的情况(可能不是您的情况)。
推荐阅读
- php - 限制 wordpress 页面中的几个类别
- php - 从 php 版本 7.0 切换到 7.1 后,PDF 创建不再有效
- javascript - 我对传感器的理解和js代码是否正确
- r - 如何从 CRAN(在 MacOS 上)在 R 上安装软件包?
- python - 如何将给定 URL 中的值导入 python
- java - 如何有效地使用 apache-poi 从 FTP 服务器读取大型 excel 文件?
- mfc - 检测是否使用 MFC 安装了 Opera 浏览器
- vue.js - 除了单击的按钮外,如何禁用按钮?
- c# - Is there any Solution for my code problem in webbrowser to identify between Select tag and option
- react-native - react-navigation 和 api 调用的 Redux 错误