Google 语音识别流 API 通过 curl
Google Speech Recognition Streaming API via curl
我想通过流式传输方法使用 Googles 语音识别 API,所以我流式传输我的文件并实时获取文本。这是必需的,这样我就知道音频文件中什么时候说了什么。问题是,我不使用任何语言 Google 提供 SDK,并且他们的文档没有显示如何在没有他们的 SDK 的情况下提出这样的请求。
有人知道怎么做吗?
Google 云语音识别 API 的流式支持可用 only through gRPC,原因是仅使用普通的旧 REST [=32] 很难或几乎不可能实现流式传输=]s.
Streaming Speech Recognition allows you to stream audio to the Cloud
Speech API and receive a stream speech recognition results in real
time as the audio is processed. See also the audio limits for
streaming speech recognition requests. Streaming speech recognition is
available via gRPC only.
话虽如此,Cloud Speech API Client library is available in the following languages 涵盖了相当多的常见开发人员语言。
- C#
- Go
- Java
- Node.JS
- PHP
- Python
- Ruby
由于您没有提到您正在使用的语言,如果您使用的语言不是上述列表中的一种语言,您可以查看客户端库源代码(针对不同的语言)以及它如何使用 gRPC 进行流式处理并以您正在使用的语言实现它。
同样,现在唯一的限制是 language which gRPC has support for。与上面的列表相比,gRPC 已经支持 C++ 和 Objective C。因此,如果您使用其中之一,这很可能是一个可行的选择,尽管需要深入研究客户端库代码库。
我同意在 google 客户端库中支持 C++ and/or ObjectiveC 对开发人员非常有用。
更新:
在快速搜索中,我发现 this github repo 几乎没有关于如何使用 C++ 调用 Google Cloud Speech API 的示例(尽管仍然不确定那是否是您使用的语言) .
我想通过流式传输方法使用 Googles 语音识别 API,所以我流式传输我的文件并实时获取文本。这是必需的,这样我就知道音频文件中什么时候说了什么。问题是,我不使用任何语言 Google 提供 SDK,并且他们的文档没有显示如何在没有他们的 SDK 的情况下提出这样的请求。
有人知道怎么做吗?
Google 云语音识别 API 的流式支持可用 only through gRPC,原因是仅使用普通的旧 REST [=32] 很难或几乎不可能实现流式传输=]s.
Streaming Speech Recognition allows you to stream audio to the Cloud Speech API and receive a stream speech recognition results in real time as the audio is processed. See also the audio limits for streaming speech recognition requests. Streaming speech recognition is available via gRPC only.
话虽如此,Cloud Speech API Client library is available in the following languages 涵盖了相当多的常见开发人员语言。
- C#
- Go
- Java
- Node.JS
- PHP
- Python
- Ruby
由于您没有提到您正在使用的语言,如果您使用的语言不是上述列表中的一种语言,您可以查看客户端库源代码(针对不同的语言)以及它如何使用 gRPC 进行流式处理并以您正在使用的语言实现它。
同样,现在唯一的限制是 language which gRPC has support for。与上面的列表相比,gRPC 已经支持 C++ 和 Objective C。因此,如果您使用其中之一,这很可能是一个可行的选择,尽管需要深入研究客户端库代码库。
我同意在 google 客户端库中支持 C++ and/or ObjectiveC 对开发人员非常有用。
更新: 在快速搜索中,我发现 this github repo 几乎没有关于如何使用 C++ 调用 Google Cloud Speech API 的示例(尽管仍然不确定那是否是您使用的语言) .