python - 使用 BERT 提取产品特征
问题描述
如何使用BERT从文本中提取产品特征?
例如,如何从下一封电子邮件中提取 id - WSK30015675、KTXFFC156、4569TT11DRE
Hello John, Please order 15 dresses ID WSK30015675 from our storage. Thanks.
Hello Dan, this week we need to make sure we have KTXFFC156. And please make sure to order more of 4569TT11DRE. tnx :)
笔记:
- 没有正则表达式
- id未知
- 有足够的标记数据(电子邮件 >> ids)
- id 是不同长度的数字和字母的组合
解决方案
您需要检测哪些词是产品功能,因此您应该使用此架构
这种架构在类似的任务中实现,如下所示:
https://gab41.lab41.org/how-to-fine-tune-bert-for-named-entity-recognition-2257b5e5ce7e
https://towardsdatascience.com/named-entity-recognition-ner-with-bert-in-spark-nlp-874df20d1d77
推荐阅读
- python - Pandas Iterrows:更快的选择?
- python-3.x - Python TKinter 调整按钮中的文本
- javascript - 如何使用带有正则表达式搜索选项的填充
- signal-processing - 为什么 16QAM 的 BER 优于 32QAM
- flask - 如何使用 AWS 应用程序负载均衡器避免 access-control-allow-origin 标头错误
- tensorflow-federated - TFF :每个客户端都执行预训练函数而不是 build_federated_averaging_process
- swift - 如何在集合视图中快速创建具有倾斜效果的捕捉滑块?
- mysql - Attunity 零时间戳值插入 mySQL DB
- boost - 构建一个使用本地发行版的 boost 的 cmake 项目
- android - 将数据从 BottomSheetFragment 传递到前一个 Fragment