外语语音转文本和文本转语音
Speech to text and text to speech for foreign languages
我正在考虑将我为 iPhone 和 Android 构建的语音 2D HTML5 网络游戏移植到 Unity2D。我是一名全栈网络开发人员,而不是 Unity 开发人员,因此代理机构会帮助我构建 Unity 应用程序。在与他们签约之前,我需要确保 Speech to Text (STT)
和 Text to Speech (TTS)
服务都可用于 普通话、西班牙语、和英语,否则我会浪费很多钱。
对于 Web,Webkit 语音(STT Docs, STT Demo, TTS Docs, TTS Demo) is easily accessible via the browser. I've found that IBM Watson has an API available, and has demos for STT and TTS, and I've found that they have a Unity SDK 这里,但我没有测试 Unity SDK 的技能。
我正在寻找有关该机构可用于这三种外语的出色 STT 和 TTS API 的指导。
- Unity SDK 是否支持前端 STT 和 TTS 音频流? STT 需要捕获用户的语音输入并快速转录。同样,TTS 需要允许用户将鼠标悬停在目标语言单词上并收听接近母语的发音。
- 是否同时提供西班牙语、普通话和英语的 STT 和 TTS?
- 还有哪些符合我要求的NLP API?
抱歉,我是 Unity/phone 开发的新手,因此此处的任何指导都将非常有帮助。如果不存在满足这些要求的 API,那么 Unity 将无法用于我的应用程序,因为 STT 和 TTS 至关重要。
总的来说,Unity 中的实时录音很糟糕,系统根本就不是为连续录音而设计的。您可以使用 AudioSource 录制剪辑,但这是固定长度的剪辑,而不是流媒体解决方案。
对于流式传输,您可以使用 AudioFilterRead 获取音频,但它并不是真正用于录制的 API,更多的是用于效果。对于录制,它具有不可预测的延迟并且还会显着减慢 UI。
因此,您只能进行一键通式交互,无法进行实时交互。
如果您有其他选择,最好也考虑一下。比如你可以考虑native app.
我正在考虑将我为 iPhone 和 Android 构建的语音 2D HTML5 网络游戏移植到 Unity2D。我是一名全栈网络开发人员,而不是 Unity 开发人员,因此代理机构会帮助我构建 Unity 应用程序。在与他们签约之前,我需要确保 Speech to Text (STT)
和 Text to Speech (TTS)
服务都可用于 普通话、西班牙语、和英语,否则我会浪费很多钱。
对于 Web,Webkit 语音(STT Docs, STT Demo, TTS Docs, TTS Demo) is easily accessible via the browser. I've found that IBM Watson has an API available, and has demos for STT and TTS, and I've found that they have a Unity SDK 这里,但我没有测试 Unity SDK 的技能。
我正在寻找有关该机构可用于这三种外语的出色 STT 和 TTS API 的指导。
- Unity SDK 是否支持前端 STT 和 TTS 音频流? STT 需要捕获用户的语音输入并快速转录。同样,TTS 需要允许用户将鼠标悬停在目标语言单词上并收听接近母语的发音。
- 是否同时提供西班牙语、普通话和英语的 STT 和 TTS?
- 还有哪些符合我要求的NLP API?
抱歉,我是 Unity/phone 开发的新手,因此此处的任何指导都将非常有帮助。如果不存在满足这些要求的 API,那么 Unity 将无法用于我的应用程序,因为 STT 和 TTS 至关重要。
总的来说,Unity 中的实时录音很糟糕,系统根本就不是为连续录音而设计的。您可以使用 AudioSource 录制剪辑,但这是固定长度的剪辑,而不是流媒体解决方案。
对于流式传输,您可以使用 AudioFilterRead 获取音频,但它并不是真正用于录制的 API,更多的是用于效果。对于录制,它具有不可预测的延迟并且还会显着减慢 UI。
因此,您只能进行一键通式交互,无法进行实时交互。
如果您有其他选择,最好也考虑一下。比如你可以考虑native app.