首页 > 解决方案 > 如何在不使用显示的情况下将文本转换为语音,而是将文件保存为 mp3?(Python)

问题描述

如何在不使用显示的情况下将文本转换为语音,而是将文件保存为 mp3?(Python)

我想将我的音频保存到文件中,但我不知道我能做什么

完整代码 - https://colab.research.google.com/github/d8oss/akeke/blob/main/DeepVoice.ipynb

但我想在我的操作系统上执行此操作。

(这不是整个代码)

    import torch

language = 'ru'
speaker = 'baya_16khz'
device = torch.device('cpu')
model, symbols, sample_rate, example_text, apply_tts = torch.hub.load(repo_or_dir='snakers4/silero-models',
                                                                      model='silero_tts',
                                                                      language=language,
                                                                      speaker=speaker)
model = model.to(device)  # gpu or cpu

audio = apply_tts(texts=["Привет как дела"],
                  model=model,
                  sample_rate=sample_rate,
                  symbols=symbols,
                  device=device)

print(example_text)
display(Audio(audio[0], rate=sample_rate))

另一个词-我如何在我的桌面上执行此脚本https://colab.research.google.com/github/d8oss/akeke/blob/main/DeepVoice.ipynb

标签: python

解决方案


您可以torchaudio为此使用:

import torchaudio

从 获取音频后apply_tts,使用以下代码将音频另存为 MP3:

torchaudio.save(f'test_1.mp3',
                  audio[0].unsqueeze(0),
                  sample_rate=16000)

资源


推荐阅读