首页 > 解决方案 > 使用 python 制作 TTS 应用程序,但适用于其他语言

问题描述

我想创建 TTS 应用程序。
我为此搜索并找到了许多库,但它们没有使用我的语言(乌兹别克语)。如果我使用它们,结果不正确。
所以我想用我自己的声音为 TTS 制作自己的库。但我找不到办法做到这一点。谁能帮忙。我怎么做这个?

标签: pythontext-to-speech

解决方案


对于乌兹别克语,您可以使用eSpeak-NGPythonpy-espeak-ng模块:https
://pypi.org/project/py-espeak-ng/ 根据eSpeak 文档,它支持 158 种语言,包括乌兹别克语。
这是示例:

from espeakng import ESpeakNG
esng = ESpeakNG()
esng.voice = 'uz'
esng.say('Salom Dunyo')

但如果您想使用自己的声音,请查看实时语音克隆
您可以采用预训练模型并在您自己的样本上重新训练它。

TTS with Real-Time Voice Cloning这里还有一本关于在 Google Colab 中设置环境的好手册:
https ://medium.com/wavy-engineering/text-to-speech-with-real-time-voice-cloning-16346127742


推荐阅读