python - 使用 python 制作 TTS 应用程序,但适用于其他语言
问题描述
我想创建 TTS 应用程序。
我为此搜索并找到了许多库,但它们没有使用我的语言(乌兹别克语)。如果我使用它们,结果不正确。
所以我想用我自己的声音为 TTS 制作自己的库。但我找不到办法做到这一点。谁能帮忙。我怎么做这个?
解决方案
对于乌兹别克语,您可以使用eSpeak-NG
Pythonpy-espeak-ng
模块:https
://pypi.org/project/py-espeak-ng/
根据eSpeak 文档,它支持 158 种语言,包括乌兹别克语。
这是示例:
from espeakng import ESpeakNG
esng = ESpeakNG()
esng.voice = 'uz'
esng.say('Salom Dunyo')
但如果您想使用自己的声音,请查看实时语音克隆。
您可以采用预训练模型并在您自己的样本上重新训练它。
TTS with Real-Time Voice Cloning
这里还有一本关于在 Google Colab 中设置环境的好手册:
https ://medium.com/wavy-engineering/text-to-speech-with-real-time-voice-cloning-16346127742
推荐阅读
- python - 如何按顺序计算列表的重复数
- javascript - 仅在 page.goto(url) 实际加载页面时执行 page.evaluate()
- php - 用 php 代码对 php 代码进行基准测试是一种可靠的方法吗?
- git - 如何在不推送到远程的情况下将 origin/master 带到最新的提交?
- c - 如何用 BNO055 测量 Z 轴的方向差?
- python-3.x - ModuleNotFoundError:没有名为“aiohttp”的模块
- proxy - 将快递应用重定向到外部网站,导致代理错误
- charts - 使用 Tree Map 的 Vega 图表,文本覆盖在矩形框之外
- ssl - 远程服务器响应时间长的问题
- twitter-bootstrap - 在本地使用 twitter 引导程序