首页 > 解决方案 > 使用 VTT 作为 Google Text to Speech 的文本源生成音频?

问题描述

对于手语视频,没有正常存在的音频;但是,我们确实提供了 VTT 字幕文件,用于将字幕翻译成英文。VTT 确实有每个提示文本块的时间开始和时间结束。

我想知道是否可以使用 VTT 作为文本源来生成文本到语音音频,其中速度由字幕文件中的时间码控制。

目前没有找到任何东西。通常情况是相反的——音频到字幕——但我想将字幕转换为音频(美国英语)。

标签: google-text-to-speech

解决方案


推荐阅读