nlp - 如何使用 NLP 从成分中提取主要食物词?
问题描述
假设我有以下成分列表:
1 fresh baguette, cut into sandwich parts
1 tablespoon good quality unsalted butter, per sandwich (so 4 tbsp if making 4 sandwiches)
1 apple or gala preferably (2 apples for 4 sandwiches)
1 slice of english blue cheese, preferably a stilton (again, or 4 slices for 4 sandwiches)
我想做的是从成分列表中提取主要的食物词。所以结果应该是:
baguette
butter
apple
cheese
我如何使用 NLP 来做到这一点?或者还有什么我可以用来做这件事的吗?
解决方案
您可以尝试命名实体提取。SpaCy 的 NER 模型运行良好,可以根据您的用例进行进一步调整。根据文档:
命名实体是分配了名称的“现实世界对象”——例如,人、国家、产品或书名。spaCy 可以通过向模型询问预测来识别文档中各种类型的命名实体。因为模型是统计的,并且很大程度上依赖于他们训练的例子,所以这并不总是完美的,以后可能需要一些调整,具体取决于您的用例。
你可以在这里找到更多信息
推荐阅读
- java - 如果我们将 Optional.of 方法设为私有,并且在 Java 中只允许 Optional.ofNullable 会怎样;除了向后兼容还有什么问题吗?
- java - 在 RecyclerviewMergeAdapter 中使用不同适配器在一个 recyclerview 中搜索项目
- python-3.x - 编写一个关于一组虚拟扑克牌的函数,量化为 52 张牌
- php - phpMyAdmin 无法连接 mysql
- firebase - 我必须使用服务器端代码来让我的应用程序与 firebase/firestore 交互吗?
- python - Pyinstaller 可执行文件不断打开
- mysql - 如何简化选择查询
- docker - 如果每个后端都位于 Kubernetes 中的单独 pod 和主机上,前端如何与后端通信?
- android-recyclerview - 从后台恢复后 MvxRecyclerView 不更新
- ios - 应用编辑时 NSTextView 滚动点发生变化