使用热词/关键字开始录制语音识别

Using hotwords / keywords to start recording speech recognition

我想构建一个脚本，使用语音识别来记录所说的内容，并在说出关键字后将其转换为文本。

我看过 Uberi 的语音识别包，它几乎提供了我需要的一切，可以记录所有语音并将其转换为文本。

有没有什么方法可以像Alexa一样，每次触发一个关键词都会触发录音？例如，A 就经济市场发表了 30 分钟的演讲。在演讲中，他提到了"Crisis,""Recession,"和"Market Crash."

等词

是否可以记录并转换为文本 - 可能是关键字被触发后所说内容的接下来 10 秒？

我在做类似的事情。您可能需要考虑使用：

snowboy关键词检测库https://snowboy.kitt.ai/docs to 检测关键字。您可以有多个关键字。你需要定义首先是模型。
在出现第一个静音时将句子剪掉，并将其存储在音频文件中
使用之前生成的音频文件作为输入调用翻译服务API（例如Google）。我试过这个：https://cloud.google.com/speech-to-text/docs/

您可以使用麦克风或音频文件作为 snowboy 的输入。

希望对您有所帮助