使用热词/关键字开始录制语音识别

Using hotwords / keywords to start recording speech recognition

我想构建一个脚本,使用语音识别来记录所说的内容,并在说出关键字后将其转换为文本。

我看过 Uberi 的语音识别包,它几乎提供了我需要的一切,可以记录所有语音并将其转换为文本。

有没有什么方法可以像Alexa一样,每次触发一个关键词都会触发录音?例如,A 就经济市场发表了 30 分钟的演讲。在演讲中,他提到了"Crisis,""Recession,"和"Market Crash."

等词

是否可以记录并转换为文本 - 可能是关键字被触发后所说内容的接下来 10 秒?

我在做类似的事情。您可能需要考虑使用:

  • snowboy关键词检测库https://snowboy.kitt.ai/docs to 检测关键字。您可以有多个关键字。你需要定义 首先是模型。
  • 在出现第一个静音时将句子剪掉,并将其存储在音频文件中
  • 使用之前生成的音频文件作为输入调用翻译服务API(例如Google)。我试过这个:https://cloud.google.com/speech-to-text/docs/

您可以使用麦克风或音频文件作为 snowboy 的输入。

希望对您有所帮助