首页 > 解决方案 > NLP : 患者医疗文本文件的错误/未知/拼写错误文本检测模型

问题描述

我从互联网上获得的患者病历文本文件很少,我想识别/查找质量差的文件(拼写错误的单词/单词/错误单词之间的特殊字符)和质量好的文件(干净的文本)。我想使用文本挖掘/NLP 建立错误检测模型。

1)有人可以帮助我了解特征提取和模型选择的方法和解决方案。2)是否有任何医疗记录的医疗语料库来识别拼写错误/错误的单词。

标签: nlpdata-sciencetext-miningmedical

解决方案


你可以做 biobert 做上下文拼写检查,

链接:https ://github.com/dmis-lab/biobert


推荐阅读