使用 python 制作 TTS 应用程序，但适用于其他语言

Question

我想创建 TTS 应用。
我为此搜索并找到了许多库，但它们不使用我的语言（乌兹别克语）。如果我使用它们，结果不正确。
所以我想用自己的声音为 TTS 制作自己的库。但我找不到办法做到这一点。谁能帮忙。我是怎么做到的？

Answer 1

对于乌兹别克语，您可以将 eSpeak-NG 与 py-espeak-ng Python 模块一起使用：https://pypi.org/project/py-espeak-ng/
根据 eSpeak documentation，它支持 158 种语言，包括乌兹别克语。
这是示例：

from espeakng import ESpeakNG
esng = ESpeakNG()
esng.voice = 'uz'
esng.say('Salom Dunyo')

但是如果你想用自己的声音，看看Real-time Voice Cloning。
您可以采用预训练模型并在您自己的样本上重新训练它。

还有一本关于在 Google Colab 中设置 TTS with Real-Time Voice Cloning 环境的好手册：
https://medium.com/wavy-engineering/text-to-speech-with-real-time-voice-cloning-16346127742

Make TTS app with python but for other languages