首页 > 解决方案 > 我应该使用 NLP 来检测元数据中的实体吗?如何?

问题描述

我有一些关于建筑物的元数据,这里是一个例子:
AHU-S-6F-01.RA.CO2.1
我正在寻找一种方法让计算机能够识别元数据中的实体,例如:
[Location].[Sensor-Type].[Sensor-Element].[Sensor-ID]
数据集中还有其他数据格式,所以我想我可以使用命名实体识别 (NER) 并由 Tensorflow.js 实现,以使计算机学会识别元数据中的实体并给它们打上标签。我在下面找到了一个例子:

https://monkeylearn.com/text-analysis/

命名实体识别 (NER) 是否适合用于检测元数据中的实体?如何通过 Tensorflow.js 实现它?
如果没有,我应该用什么来解决这个问题?
谢谢!!!

标签: nlpmetadatatensorflow.jstaggingnamed-entity-recognition

解决方案


如果您的信息是完全可预测的(确定性的),每个字段都是预期的并且每个值都是预定义的,我会选择正则表达式。

NLP/NER 技术需要一些训练(成百上千个训练示例),如果值随时间变化,您必须使用新示例重新训练。它可以处理出现歧义的情况(可能不是您的情况)。


推荐阅读