首页 > 解决方案 > 如何使用 Python 将双交替语言音频剪辑转换为文本?

问题描述

我正在尝试将一些双语音频剪辑转换为文本。剪辑以英语开头,然后语言变为德语,然后又变为英语。

下面是我的代码:

import speech_recognition as sr

r = sr.Recognizer()
audio_file = sr.AudioFile('path_to_audio')

with audio_file as source:
    audio_file_record = r.record(source)

print(r.recognize_google(audio_file_record, language='en-US'))
print(r.recognize_google(audio_file_record, language='de-DE'))

问题是 first print statement 只在 Deutsch 之前打印英文音频部分,在 Deutsch 之后不打印英文。

如何使用两种语言的全文进行完整的剪辑转换?

我知道我可以设置offsetduration到达剪辑的特定部分,但是解决方案将特定于我不想要的剪辑。

标签: pythonspeech-recognitionspeech-to-text

解决方案


推荐阅读