首页 > 解决方案 > NLP:提取形状名称和形状尺寸

问题描述

我是 NLP 初学者。我正在处理一项任务,我必须处理文本以绘制形状。

我做了一些研究,发现 tokenregex 可能很合适。

例如

文本:请你画一个等腰三角形,高为 150,底为 100。

在这里,我的方法是编写 tokensregex 规则来提取形状名称和尺寸。一旦我得到这两个数据,我将用给定的尺寸绘制提取的形状。

我选择使用 tokensregex 是否正确?

或者有没有其他方法可以巧妙地做到这一点?

标签: c#nlp

解决方案


鉴于您问题的明确界限,Tokensregex 可能是正确的方法。你可能会花一些时间让它成熟。但这应该是首选方式。但在你最终确定你的方法之前,我建议你将它与一些深度解析技术相提并论。这是您可以得到的,您可以结合一些已知形状的字典并编写提取逻辑。

 (ROOT
  (SQ (MD Could)
    (NP (PRP you))
    (VP (VB please)
      (VP (VB draw)
        (NP (DT an) (NNP Isosceles) (NN triangle))
        (PP (IN with)
          (NP
            (NP
              (NP (DT an) (NN altitude))
              (PP (IN of)
                (NP (CD 150))))
            (CC and)
            (NP
              (NP (DT a) (NN base))
              (PP (IN of)
                (NP (CD 100))))))))
    (. .)))

在这里,你得到了高度 - 150 和基础 - 100 的现成块。看看这是否有帮助。


推荐阅读