python - 用于捕获语音以供 Julius 识别的 adintool 或psychopy?
问题描述
我正在与Julius合作以识别语音。只要麦克风正在运行,我希望将语音始终传递给 Julius,并将单个单词存储到库中。我正在寻找仅在以最低的内存和数据使用率检测到语音时记录和/或传递音频的最佳方法。
adintool是为 Julius 开发的。会是这样的代码:
(sender) % adintool -in mic -out adinnet -server receiver_hostname
(receiver) % julius -C ... -input adinnet
建议使用 adintool 可以让我在服务器模式下将音频传递给 Julius?
PsychoPy是基于 Python 的,虽然我更熟悉 Python,但 Julius 是用 C 编写的。PsychoPy 会录制声音并将其作为 WAV 文件发送给 Julius。这让我怀疑它会更依赖内存和数据资源。
这个线程有一些有用的建议,只在有声音的时候录音。在 adintool 或 PsychoPy 之前使用它是否有意义?还是那些工具已经具备这种能力?
摘要:在 adintool 和 PsychoPy 之间,这是 julius 处理的轻量级音频捕获的最佳选择,并且仅在有声音时才需要额外的代码来录制/捕获?
解决方案
你最好使用Python 中的https://pythonhosted.org/pyjulius/之类的东西。Julius 服务器将自己录制音频,然后将转录的文本发回给您。
推荐阅读
- ruby-on-rails - 未找到资源类(omniauth)
- python - 如何更新 cupy/CUDA 以使其再次工作并修复我的 conda 环境?
- tensorflow - 如何将 gs 存储桶中的数据用作 keras 数据集?
- python - 如何通过访问分组数据的特定列然后将其转换回数据帧来对分组数据执行计算
- django - Django:在获取请求中返回了来自表单的不正确的下拉值
- r - 将 2 列 5 行的数据框变成 5 列 1 行的数据框
- docusignapi - 用于远程签名的身份验证类型 (Docusign)
- postgresql - Postgres 函数的默认语言是什么?
- r - 是否有可能在 Shiny 应用程序中捕获所有错误?
- python - Jupyter 笔记本不规律地变得无响应