首页 > 解决方案 > 如何使用 NLP 从成分中提取主要食物词?

问题描述

假设我有以下成分列表:

1 fresh baguette, cut into sandwich parts
1 tablespoon good quality unsalted butter, per sandwich (so 4 tbsp if making 4 sandwiches)
1 apple or gala preferably (2 apples for 4 sandwiches)
1 slice of english blue cheese, preferably a stilton (again, or 4 slices for 4 sandwiches)

我想做的是从成分列表中提取主要的食物词。所以结果应该是:

baguette
butter
apple
cheese

我如何使用 NLP 来做到这一点?或者还有什么我可以用来做这件事的吗?

标签: nlp

解决方案


您可以尝试命名实体提取。SpaCy 的 NER 模型运行良好,可以根据您的用例进行进一步调整。根据文档:

命名实体是分配了名称的“现实世界对象”——例如,人、国家、产品或书名。spaCy 可以通过向模型询问预测来识别文档中各种类型的命名实体。因为模型是统计的,并且很大程度上依赖于他们训练的例子,所以这并不总是完美的,以后可能需要一些调整,具体取决于您的用例。

你可以在这里找到更多信息


推荐阅读