首页 > 解决方案 > 使用下一代模型的 IBM Watson Speech-to-Text 错误 500

问题描述

我正在尝试使用 Watson 的语音到文本 api 转录一个音频文件(大约一小时长的 mp3)。我在使用下一代音频模型时收到“错误代码 500”(内部服务器错误)。

我的 shell 脚本如下所示:

URL="https://api.us-south.speech-to-text.watson.cloud.ibm.com/instances/53f5d97d-ad19-4fb7-909a-57279fcadef2/v1/recognize?"
PARAMS="model=en-US_Multimedia&timestamps=true&inactivity_timeout=-1"
APIKEY="*****"
FROOT="20210704/full_audio"

echo $FROOT
echo $URL$PARAMS

curl \
-X POST \
-u "apikey:$APIKEY" \
--header "Content-Type: audio/mp3" \
--data-binary @$FROOT.mp3 \
"$URL$PARAMS" \
-o $FROOT.txt

这将返回错误代码 500,报告为某些内部服务器错误。

当我将多媒体模型换成“en-US_Telephony”时,一切正常并产生了转录。如果没有下一代模型(使用默认的传统算法),它也可以正常工作。我想要多媒体模型的更高质量的结果。

有没有人遇到过类似的问题,或者可以就可能发生的事情提供一些帮助?

标签: runtime-erroribm-watsonspeech-to-text

解决方案


推荐阅读