使用 python 制作 TTS 应用程序,但适用于其他语言
Make TTS app with python but for other languages
我想创建 TTS 应用。
我为此搜索并找到了许多库,但它们不使用我的语言(乌兹别克语)。如果我使用它们,结果不正确。
所以我想用自己的声音为 TTS 制作自己的库。但我找不到办法做到这一点。谁能帮忙。我是怎么做到的?
对于乌兹别克语,您可以将 eSpeak-NG
与 py-espeak-ng
Python 模块一起使用:https://pypi.org/project/py-espeak-ng/
根据 eSpeak documentation,它支持 158 种语言,包括乌兹别克语。
这是示例:
from espeakng import ESpeakNG
esng = ESpeakNG()
esng.voice = 'uz'
esng.say('Salom Dunyo')
但是如果你想用自己的声音,看看Real-time Voice Cloning。
您可以采用预训练模型并在您自己的样本上重新训练它。
还有一本关于在 Google Colab 中设置 TTS with Real-Time Voice Cloning
环境的好手册:
https://medium.com/wavy-engineering/text-to-speech-with-real-time-voice-cloning-16346127742
我想创建 TTS 应用。
我为此搜索并找到了许多库,但它们不使用我的语言(乌兹别克语)。如果我使用它们,结果不正确。
所以我想用自己的声音为 TTS 制作自己的库。但我找不到办法做到这一点。谁能帮忙。我是怎么做到的?
对于乌兹别克语,您可以将 eSpeak-NG
与 py-espeak-ng
Python 模块一起使用:https://pypi.org/project/py-espeak-ng/
根据 eSpeak documentation,它支持 158 种语言,包括乌兹别克语。
这是示例:
from espeakng import ESpeakNG
esng = ESpeakNG()
esng.voice = 'uz'
esng.say('Salom Dunyo')
但是如果你想用自己的声音,看看Real-time Voice Cloning。
您可以采用预训练模型并在您自己的样本上重新训练它。
还有一本关于在 Google Colab 中设置 TTS with Real-Time Voice Cloning
环境的好手册:
https://medium.com/wavy-engineering/text-to-speech-with-real-time-voice-cloning-16346127742