python - 如何在不使用显示的情况下将文本转换为语音,而是将文件保存为 mp3?(Python)
问题描述
如何在不使用显示的情况下将文本转换为语音,而是将文件保存为 mp3?(Python)
我想将我的音频保存到文件中,但我不知道我能做什么
完整代码 - https://colab.research.google.com/github/d8oss/akeke/blob/main/DeepVoice.ipynb
但我想在我的操作系统上执行此操作。
(这不是整个代码)
import torch
language = 'ru'
speaker = 'baya_16khz'
device = torch.device('cpu')
model, symbols, sample_rate, example_text, apply_tts = torch.hub.load(repo_or_dir='snakers4/silero-models',
model='silero_tts',
language=language,
speaker=speaker)
model = model.to(device) # gpu or cpu
audio = apply_tts(texts=["Привет как дела"],
model=model,
sample_rate=sample_rate,
symbols=symbols,
device=device)
print(example_text)
display(Audio(audio[0], rate=sample_rate))
另一个词-我如何在我的桌面上执行此脚本https://colab.research.google.com/github/d8oss/akeke/blob/main/DeepVoice.ipynb
解决方案
您可以torchaudio
为此使用:
import torchaudio
从 获取音频后apply_tts
,使用以下代码将音频另存为 MP3:
torchaudio.save(f'test_1.mp3',
audio[0].unsqueeze(0),
sample_rate=16000)
推荐阅读
- python - 如何纠正python填充之间的错误,TypeError:'PolyCollection'对象不可迭代
- angularjs - 如何在 ionic1 codova 项目中集成原生应用程序代码?
- python - Python:如何从类可访问的类方法中创建一个变量?
- vhdl - VHDL:添加两个数字时的边界检查错误
- visual-studio - 如何计算 Visual Studio 解决方案中的所有方法
- javascript - 来自 excel 文件的 Webdriver IO 控制测试
- reactjs - 已发布站点上的状态重置,在本地主机上工作正常
- c# - 如何在 Azure AD B2C 中配置 Microsoft 帐户身份提供程序以重定向到我的 URL
- java - 当框架小于表格时,GridBagLayout 导致 JScrollPane 消失
- angular - 当输入采用无效值时,不会出现自定义验证器