我有从 0 到 99 的 wav 文件,在连接时让它们听起来不错的最佳逻辑是什么?

I have wav files from number 0 to 99, what's the best logic to make them sound good when concatenated?

例如,我"give"号码1736,我有100个.wav文件(如0.wav、1.wav等),我应该如何拼接音频才能制作它们听起来更 "fluid"。 大多数时候他们在数字和声音之间有很大的差距"hard",我想听他们就像真人在说,好吧,尽可能接近(不包括音质)。

这可以是任何语言,PHP、Python 等。我只需要 logic/algorithm。

不确定这是否是一个模糊的问题,请随时告诉我,如果是的话我会删除它。

谢谢。

您可能遇到的问题是语调。

说话时,升调和降调有助于指示措辞。如果我说 "one, seven, three, six",并以降调结束(音高下降),这听起来是最终的,听众知道他们已经听到了所有数字。如果我以升调结束(音高上升),听起来我在问一个问题,这对听众来说很奇怪,因为数字不是问题。

为了让这个声音更自然,至少,你需要用不同的语调来录制每个音调,并将它们正确地组合在一起。

措辞还有一个问题。说话时,以连贯的气势,用吐字吐字为妙。如果您要录制广播播音员的声音并在过滤掉所有较高频率的同时播放它,这样您就听不到清晰度,您会听到接近连续音调的声音,音调会稍微改变。这不是通过将音频文件连接在一起得到的。你能做的最好的事情就是让一个合适的语音引擎说话。

另请参阅: