如何立即将 Twilio 语音通话直接流式传输到 Google 语音 API
How to stream a Twilio voice call directly to Google voice API instantly
我对在我的 python 应用程序中实现某项功能存疑。我正在使用 Twilio 的 python SDK 进行呼叫处理和响应。拨打 Twilio 电话时,我想要一种功能,可以在通话过程中 将呼叫者的语音直接流式传输到 Google 语音 API 以进行文本转录 。然后我需要处理转录的文本以立即向用户提供适当的响应。
我知道 twilio 中的 Record 功能可以帮助我们录制来电者的声音并将其保存为录音。一种方法是在录音文件可用后访问录音文件,然后将录音文件传递给 Google API。但我觉得这种方式会更慢,因为我需要将呼叫者的语音立即传输到 Google 语音 API。
<?xml version="1.0" encoding="UTF-8"?>
<Response>
<Record timeout="10" transcribe="true" />
</Response>
</code>Python代码:
<code>
SDK Version: 6.x
`从 twilio.twiml.voice_response 导入记录,语音响应
</code>response = VoiceResponse()
<code>
response.record(超时=10,转录=真)
打印(响应)
它已经内置到 twilio 中。为什么要使用 google 语音 api 进行转录,您可以使用任何内容进行重定向,将其作为来自特定服务帐户的电子邮件发送,并为这些电子邮件构建标签或过滤器以将它们分类或隔离到它们自己的文件夹。
我可能完全不知道你在做什么,但你可以在拨号后立即在响应中使用录音功能并将转录设置为 true。
https://www.twilio.com/docs/voice/twiml/record
这里是 Twilio 开发人员布道者。
这些天您实际上可以在 Twilio 中执行此操作。使用 <Gather>
TwiML verb with the input
attribute set to "speech" Twilio 将通过 Google 语音播放您的音频 API 以实时转录它。
您可以通过在应用程序中将 action
attribute 设置为 URL 来获取转录结果。当 Twilio 和 Google 检测并转录语音时,Twilio 将对 URL 进行 webhook,并将转录的文本作为请求正文中的 SpeechResult
参数发送。
虽然您不能自己从通话中获取原始音频,因此这是实现您正在尝试构建的内容的最佳方式。
解决方案一:
TwiML 的新更新将帮助您解决此问题。
新的 TwiML stream 命令将调用音频流传输到 websocket 服务器。
这样可以轻松地将您的通话音频从您的业务 phone 系统转移到一个 AI 平台,该平台可以使用 Google Cloud 的语音实时转录该数据-使用 Twilio 的媒体流转文本。
阅读下面的文档link
Google Speech to text Twilio Integration
方案二:
我发现更好的解决方案是 Twilio 提供的附加功能可以更好地支持分析传入数据。
您可以使用 IBM-Watson Speech to text Add-on 帮助您更好地理解您的 Twilio Phone 语音.
请查看以下 twilio 的官方文档:
我对在我的 python 应用程序中实现某项功能存疑。我正在使用 Twilio 的 python SDK 进行呼叫处理和响应。拨打 Twilio 电话时,我想要一种功能,可以在通话过程中 将呼叫者的语音直接流式传输到 Google 语音 API 以进行文本转录 。然后我需要处理转录的文本以立即向用户提供适当的响应。
我知道 twilio 中的 Record 功能可以帮助我们录制来电者的声音并将其保存为录音。一种方法是在录音文件可用后访问录音文件,然后将录音文件传递给 Google API。但我觉得这种方式会更慢,因为我需要将呼叫者的语音立即传输到 Google 语音 API。
<?xml version="1.0" encoding="UTF-8"?>
<Response>
<Record timeout="10" transcribe="true" />
</Response>
</code>Python代码:
<code>
SDK Version: 6.x
`从 twilio.twiml.voice_response 导入记录,语音响应
</code>response = VoiceResponse()
<code>
response.record(超时=10,转录=真)
打印(响应)
它已经内置到 twilio 中。为什么要使用 google 语音 api 进行转录,您可以使用任何内容进行重定向,将其作为来自特定服务帐户的电子邮件发送,并为这些电子邮件构建标签或过滤器以将它们分类或隔离到它们自己的文件夹。
我可能完全不知道你在做什么,但你可以在拨号后立即在响应中使用录音功能并将转录设置为 true。 https://www.twilio.com/docs/voice/twiml/record
这里是 Twilio 开发人员布道者。
这些天您实际上可以在 Twilio 中执行此操作。使用 <Gather>
TwiML verb with the input
attribute set to "speech" Twilio 将通过 Google 语音播放您的音频 API 以实时转录它。
您可以通过在应用程序中将 action
attribute 设置为 URL 来获取转录结果。当 Twilio 和 Google 检测并转录语音时,Twilio 将对 URL 进行 webhook,并将转录的文本作为请求正文中的 SpeechResult
参数发送。
虽然您不能自己从通话中获取原始音频,因此这是实现您正在尝试构建的内容的最佳方式。
解决方案一:
TwiML 的新更新将帮助您解决此问题。 新的 TwiML stream 命令将调用音频流传输到 websocket 服务器。
这样可以轻松地将您的通话音频从您的业务 phone 系统转移到一个 AI 平台,该平台可以使用 Google Cloud 的语音实时转录该数据-使用 Twilio 的媒体流转文本。
阅读下面的文档link
Google Speech to text Twilio Integration
方案二:
我发现更好的解决方案是 Twilio 提供的附加功能可以更好地支持分析传入数据。
您可以使用 IBM-Watson Speech to text Add-on 帮助您更好地理解您的 Twilio Phone 语音.
请查看以下 twilio 的官方文档: