python-3.x - 使用 NLP 方法对医学转录进行 ASR 纠错
问题描述
我想开发一个用于自动语音识别纠错的后处理 nlp 层。后处理是为了提高转录准确性。nlp 层的工作是纠正 ASR 错误,例如误识别的单词、拼写纠正和语法校正。我发现这个问题的解决方案是使用变压器架构。我是 NLP 和机器学习的新手,我对阅读越来越多的博客和论文感到困惑。谁能指导我使用变压器架构到底意味着什么。BIOBERT 模型是目前接受了生物医学数据的培训
解决方案
推荐阅读
- javascript - 如何实现 JavaScript getUserMedia 存根以发送自定义音频字节
- python - ValueError:信号仅在主线程中有效
- scala - 通过拆分提取字符串和符号
- sql - 是否可以通过将列与另一个存在的临时表匹配来更改列?
- python - Pandas + PyMongo:将 DataFrame 写入 MongoDB
- windows - 无法访问在 swarm 集群中运行的 docker 容器
- jquery - Kendo-Vue-Grid 刷新数据源时不丢失排序的方式?
- android - Firebase Push Notofication 同时生成 apk
- aws-lambda - 如何为 API Gateway Websocket 编写 Java Lambda 处理程序?
- multithreading - Hololens - Unity:LoadImage 冻结主线程