nlp - NLP : 患者医疗文本文件的错误/未知/拼写错误文本检测模型
问题描述
我从互联网上获得的患者病历文本文件很少,我想识别/查找质量差的文件(拼写错误的单词/单词/错误单词之间的特殊字符)和质量好的文件(干净的文本)。我想使用文本挖掘/NLP 建立错误检测模型。
1)有人可以帮助我了解特征提取和模型选择的方法和解决方案。2)是否有任何医疗记录的医疗语料库来识别拼写错误/错误的单词。
解决方案
你可以做 biobert 做上下文拼写检查,
推荐阅读
- kubernetes - 如何将数据从一个 redis 集群迁移到另一个 redis 集群?
- php - 推送到数组会话 - Laravel 8.x
- python - ModuleNotFoundError:没有名为“机器”的模块
- sql - 分解 SQL 中的增量列
- html - 未初始化的常量 User::follow 提取的源代码(大约第 28 行):
- react-hook-form - 自定义解析器 React-hook-form
- c++ - 如何在 arduino ide 中使用 CMSIS 编译器库
- mysql - How to replace values of a SQL table with the previous data
- c# - 从 ViewModel Xamarin 中的 Dynaimc 表单中获取条目值
- delphi - 如何在 TTask 中读取文件?(德尔福, fmx)