首页 > 解决方案 > CMU Sphinx 的慢速语音识别

问题描述

我想使用 CMU Sphinx 5 prealpha 进行实时语音识别(用于检测一些热门词)并使用以下命令:

pocketsphinx_continuous -inmic yes\
                        -hmm zero_ru.cd_cont_4000\
                        -dict ru-dict-min.dic\
                        -lm ru-cmds-min.lm\
                        -samprate 16000

我对准确性感到满意,但我注意到有延迟。例如,我开始识别并说“你好”,Sphinx 在 1-3 秒后打印“你好”(太棒了!),我等了几分钟,然后再次说“你好”,Sphinx 在 10-18 秒后打印“你好”。我等了几分钟,然后再次说“你好”,Sphinx 会在 3-7 秒后打印“你好”。任务管理器显示 Sphinx 使用了 2-17% 的 CPU。我该如何解决?有什么问题?

我使用非常小的文件:ru-dict-min.dic 有 28 个单词,ru-min.lm 有 24 个 ngram。

标签: speech-recognitioncmusphinxpocketsphinx

解决方案


语音活动检测器选择了太多噪音,这就是 sphinx 在处理上花费太多时间的原因。


推荐阅读