首页 > 解决方案 > 实体检测 - 实体与英文单词冲突

问题描述

我有几句话如下

在上面的句子中,我正在寻找的实体分别是IS,ISME。这些实体包括 、ISMEANAM它们在用英语构建句子时很常见。我LUIS用于实体检测并将实体维护为列表实体。问题是,虽然LUIS能够检测到实体(IS, AN, AM),但它可以在正常句子中检测到它们,例如

在上面的句子中,我们没有任何实体,但实体IS被拾取。

我们如何仅在实体被实际处理而不是句子结构的一部分时才检测它们。

需要注意的几点:

标签: pythonnlpspacyazure-language-understandingnamed-entity-extraction

解决方案


正如您所说,正确解析句子将为您提供 PoS 标签,这将帮助您获得正确的答案。不幸的是,您展示的示例语法很差,因此即使是最好的解析器也可能会遇到困难。

您是否有足够的精选数据来训练神经网络?LSTM 可能会设法充分了解这些句子中实际使用的语法,从而成功地进行 NER。

在您给出的示例中,要查找的名称都是单个标记。如果这是典型的,它将使工作更容易。

下面的评论说没有足够的数据来训练神经网络。给出的几个例子是非常刻板的。是否可以使用上一个和下一个标记作为预测变量来训练朴素贝叶斯分类器?


推荐阅读