首页 > 解决方案 > 用于捕获语音以供 Julius 识别的 adintool 或psychopy?

问题描述

我正在与Julius合作以识别语音。只要麦克风正在运行,我希望将语音始终传递给 Julius,并将单个单词存储到库中。我正在寻找仅在以最低的内存和数据使用率检测到语音时记录和/或传递音频的最佳方法。

adintool是为 Julius 开发的。会是这样的代码:

(sender) % adintool -in mic -out adinnet -server receiver_hostname
(receiver) % julius -C ... -input adinnet

建议使用 adintool 可以让我在服务器模式下将音频传递给 Julius?

PsychoPy是基于 Python 的,虽然我更熟悉 Python,但 Julius 是用 C 编写的。PsychoPy 会录制声音并将其作为 WAV 文件发送给 Julius。这让我怀疑它会更依赖内存和数据资源。

这个线程有一些有用的建议,只在有声音的时候录音。在 adintool 或 PsychoPy 之前使用它是否有意义?还是那些工具已经具备这种能力?

摘要:在 adintool 和 PsychoPy 之间,这是 julius 处理的轻量级音频捕获的最佳选择,并且仅在有声音时才需要额外的代码来录制/捕获?

标签: pythonspeech-recognitionspeech-to-textpsychopyjulius-speech

解决方案


你最好使用Python 中的https://pythonhosted.org/pyjulius/之类的东西。Julius 服务器将自己录制音频,然后将转录的文本发回给您。


推荐阅读