首页 > 解决方案 > NLP:置换英语句子中构成短语的顺序

问题描述

我正在寻找一种不依赖于知识库或不特定于领域的解决方案,即适用于一般英文文本。

对于“我今天去商店”这句话,可以识别成分

<我去了商店>,<今天>

并改写为“今天我去了商店”。还可以识别成分

<我去了>,<去商店>,<今天>

并置换为“我今天去的商店”,甚至“今天我去的商店”。后两种排列方式不那么惯用,但仍然保留了意义。

我的问题——我可以使用什么策略来识别一组可以应用任意重新排序的组成短语(例如来自解析器),同时仍然保留基本含义?

上面的例子比较简单;我的用例是用于更一般的句子,例如转录的英语口语和电子邮件。

我允许结果可能不符合语法,例如“我朋友的私人果岭是昨天比赛的理想选择”可能会置换为“因为昨天的比赛是理想的我朋友的私人果岭”,这在语法上并不合理,但含义得以保留。

如果一种策略可以减少这种不合语法排列的可能性,那将是一个加分项,但不是一个要求。

标签: parsingnlpsemantics

解决方案


推荐阅读