首页 > 解决方案 > 仅在第一个音频结果上流式传输到谷歌云语音时的高延迟

问题描述

我在树莓派上为语音助手设置了谷歌云语音,当整个系统正常工作时,我遇到了一个不寻常的问题。

当我刚刚启动系统并将音频流发送到谷歌云进行实时处理时,它会在大约 15-20 秒后返回结果。随后发送的音频请求将在 1-2 秒内返回。如果系统已经在运行并且我在大约 5-10 分钟内没有发出语音请求,这种行为也会再次出现。

我正在使用 node.js SDK。这是我的配置文件:

config:{
        encoding: "LINEAR16",
        sampleRateHertz: 16000,
        languageCode: 'en-us'
    },
    singleUtterance: true,
    interimResults: false

我一次不会发送超过 4 秒的音频,因为如果超过此时间,流将被强制关闭。

我能够始终如一地重现此问题,但似乎无法理解为什么只有在系统启动或一段时间不活动时的第一个查询需要很长时间才能返回结果。

关于如何进行调试的任何想法?

编辑:我似乎只在树莓派上遇到这个问题。我的 Mac 上没有这样的第一次查询延迟。

标签: node.jsraspberry-pi

解决方案


推荐阅读