首页 > 解决方案 > 不能让谷歌 API 处理 WAV 音频

问题描述

我想从电话中转录一个简单的音频。

我目前正在使用语音 API

const speech = require('@google-cloud/speech').v1p1beta1;

关于我要转录的音频的信息:

我正在为 API 使用这个配置:

const requestGoogle = {
      audio: {
        uri: [ my audio location ]
      },
      config: {
        audioChannelCount: 2,
        enableSeparateRecognitionPerChannel: true,
        enableAutomaticPunctuation: true,
        languageCode,
        model: 'default',
        useEnhanced: true,
        interactionType: 'PHONE_CALL',
        encoding: 'MULAW',
        microphoneDistance: 'NEARFIELD',
        recordingDeviceType: 'PHONE_LINE',
      }
    };

当向 API 请求时,我收到 400 响应状态和错误消息:

{

“错误”:“3 INVALID_ARGUMENT:无效识别‘配置’:错误通道计数。”

}

如果有人可以帮助我,那就太棒了,谢谢!

标签: google-apispeech-recognitiontext-to-speechwavgoogle-cloud-speech

解决方案


转换编解码器数据 - 从编解码器:PCM MU-LAW (mlaw) - 到 - 编解码器:PCM - 使用 G711 解码器。

使用频道:单声道。


推荐阅读