runtime-error - 使用下一代模型的 IBM Watson Speech-to-Text 错误 500
问题描述
我正在尝试使用 Watson 的语音到文本 api 转录一个音频文件(大约一小时长的 mp3)。我在使用下一代音频模型时收到“错误代码 500”(内部服务器错误)。
我的 shell 脚本如下所示:
URL="https://api.us-south.speech-to-text.watson.cloud.ibm.com/instances/53f5d97d-ad19-4fb7-909a-57279fcadef2/v1/recognize?"
PARAMS="model=en-US_Multimedia×tamps=true&inactivity_timeout=-1"
APIKEY="*****"
FROOT="20210704/full_audio"
echo $FROOT
echo $URL$PARAMS
curl \
-X POST \
-u "apikey:$APIKEY" \
--header "Content-Type: audio/mp3" \
--data-binary @$FROOT.mp3 \
"$URL$PARAMS" \
-o $FROOT.txt
这将返回错误代码 500,报告为某些内部服务器错误。
当我将多媒体模型换成“en-US_Telephony”时,一切正常并产生了转录。如果没有下一代模型(使用默认的传统算法),它也可以正常工作。我想要多媒体模型的更高质量的结果。
有没有人遇到过类似的问题,或者可以就可能发生的事情提供一些帮助?
解决方案
推荐阅读
- datetime - Highcharts - 尝试在半小时点开始 x 轴刻度线
- ruby-on-rails - 用于从 Ruby on Rails 应用程序发出 HTTP 请求的传出端口
- facebook - 具有额外应用权限的 Messenger 机器人
- json - debian 上的节点应用程序:如何转义反斜杠
- html - 链接在整行中都不起作用
- php - 为上传和插入数据创建自定义函数
- amazon-web-services - 如何通过 awscli 添加和删除特定的 S3 通知事件
- sql - 每天在 Google 云之外进行 MySQL 备份
- macos - 设置无密码 ssh
- batch-file - 使用 vcom 从编译 vhdl 文件中检测错误