speech-recognition - CMU Sphinx 的慢速语音识别
问题描述
我想使用 CMU Sphinx 5 prealpha 进行实时语音识别(用于检测一些热门词)并使用以下命令:
pocketsphinx_continuous -inmic yes\
-hmm zero_ru.cd_cont_4000\
-dict ru-dict-min.dic\
-lm ru-cmds-min.lm\
-samprate 16000
我对准确性感到满意,但我注意到有延迟。例如,我开始识别并说“你好”,Sphinx 在 1-3 秒后打印“你好”(太棒了!),我等了几分钟,然后再次说“你好”,Sphinx 在 10-18 秒后打印“你好”。我等了几分钟,然后再次说“你好”,Sphinx 会在 3-7 秒后打印“你好”。任务管理器显示 Sphinx 使用了 2-17% 的 CPU。我该如何解决?有什么问题?
我使用非常小的文件:ru-dict-min.dic 有 28 个单词,ru-min.lm 有 24 个 ngram。
解决方案
语音活动检测器选择了太多噪音,这就是 sphinx 在处理上花费太多时间的原因。
推荐阅读
- javascript - 显示本地存储值的 HTML/Javascript 问题
- snappy - snappy-java 测试错误:java.lang.UnsatisfiedLinkError
- keras - 如何实现控制结构以绕过 keras 中的某些层?
- java - 我如何解决这个 if..else 条件以给我 Java 中的真正价值?
- python - 如何使用pyqt5将输入值传递给input()?
- java - Recycler View 不显示从 Firestore 数据库获取的数据
- python - ValueError: x 和 y 必须具有相同的第一维,但具有形状 (1,) 和 (224, 224, 3)
- r - 如何修复加州大学洛杉矶分校国会选区地图
- python - 从雅虎财经中提取期权日期
- sql - 使用 CASE WHEN 和 IN 和 LIKE 运算符对数据进行分类的多个条件