c# - NLP:提取形状名称和形状尺寸
问题描述
我是 NLP 初学者。我正在处理一项任务,我必须处理文本以绘制形状。
我做了一些研究,发现 tokenregex 可能很合适。
例如
文本:请你画一个等腰三角形,高为 150,底为 100。
在这里,我的方法是编写 tokensregex 规则来提取形状名称和尺寸。一旦我得到这两个数据,我将用给定的尺寸绘制提取的形状。
我选择使用 tokensregex 是否正确?
或者有没有其他方法可以巧妙地做到这一点?
解决方案
鉴于您问题的明确界限,Tokensregex 可能是正确的方法。你可能会花一些时间让它成熟。但这应该是首选方式。但在你最终确定你的方法之前,我建议你将它与一些深度解析技术相提并论。这是您可以得到的,您可以结合一些已知形状的字典并编写提取逻辑。
(ROOT
(SQ (MD Could)
(NP (PRP you))
(VP (VB please)
(VP (VB draw)
(NP (DT an) (NNP Isosceles) (NN triangle))
(PP (IN with)
(NP
(NP
(NP (DT an) (NN altitude))
(PP (IN of)
(NP (CD 150))))
(CC and)
(NP
(NP (DT a) (NN base))
(PP (IN of)
(NP (CD 100))))))))
(. .)))
在这里,你得到了高度 - 150 和基础 - 100 的现成块。看看这是否有帮助。
推荐阅读
- java - 有没有办法让 Hibernate 在查询时将 UNIQUEIDENTIFIER 类型的数据转换为 H2 DB 的字符串?
- c# - 如何将 MediaElement 内容保存在 MP4 文件中?
- python - 如何使“日期”列重新出现在我清理的数据框 fb_cleaned 的最终输出中?
- visual-studio - 我可以在没有 GUI 控件的情况下在 Visual Studio 控制台应用程序中打开和执行报表吗
- sql - SQL - CASE 语句评估 INTeger
- javascript - 从方法中设置 v-select 选项默认值
- azure - Using CORS in Azure Storage to protect from illegal access of files
- next.js - Script Component does not work in next.js
- python-3.x - Scraped data displayed differently as data frame and differently when calling single cell
- arrays - 在 React 中传递对象数组中的嵌套对象的正确方法是什么?