使用热词/关键字开始录制语音识别
Using hotwords / keywords to start recording speech recognition
我想构建一个脚本,使用语音识别来记录所说的内容,并在说出关键字后将其转换为文本。
我看过 Uberi 的语音识别包,它几乎提供了我需要的一切,可以记录所有语音并将其转换为文本。
有没有什么方法可以像Alexa一样,每次触发一个关键词都会触发录音?例如,A 就经济市场发表了 30 分钟的演讲。在演讲中,他提到了"Crisis,""Recession,"和"Market Crash."
等词
是否可以记录并转换为文本 - 可能是关键字被触发后所说内容的接下来 10 秒?
我在做类似的事情。您可能需要考虑使用:
- snowboy关键词检测库https://snowboy.kitt.ai/docs to
检测关键字。您可以有多个关键字。你需要定义
首先是模型。
- 在出现第一个静音时将句子剪掉,并将其存储在音频文件中
- 使用之前生成的音频文件作为输入调用翻译服务API(例如Google)。我试过这个:https://cloud.google.com/speech-to-text/docs/
您可以使用麦克风或音频文件作为 snowboy 的输入。
希望对您有所帮助
我想构建一个脚本,使用语音识别来记录所说的内容,并在说出关键字后将其转换为文本。
我看过 Uberi 的语音识别包,它几乎提供了我需要的一切,可以记录所有语音并将其转换为文本。
有没有什么方法可以像Alexa一样,每次触发一个关键词都会触发录音?例如,A 就经济市场发表了 30 分钟的演讲。在演讲中,他提到了"Crisis,""Recession,"和"Market Crash."
等词是否可以记录并转换为文本 - 可能是关键字被触发后所说内容的接下来 10 秒?
我在做类似的事情。您可能需要考虑使用:
- snowboy关键词检测库https://snowboy.kitt.ai/docs to 检测关键字。您可以有多个关键字。你需要定义 首先是模型。
- 在出现第一个静音时将句子剪掉,并将其存储在音频文件中
- 使用之前生成的音频文件作为输入调用翻译服务API(例如Google)。我试过这个:https://cloud.google.com/speech-to-text/docs/
您可以使用麦克风或音频文件作为 snowboy 的输入。
希望对您有所帮助