以下是几个开源的中文语音识别唤醒库:
Snowboy:是由KITT.AI开发的一个基于神经网络的语音唤醒库,支持离线识别,可以在嵌入式设备上运行。它提供了Python、C++、Java、Node.js等多种语言的API,也提供了针对Raspberry Pi等嵌入式设备的定制版本。github地址:https://github.com/Kitt-AI/snowboyPocketsphinx:是CMU Sphinx开发的一个语音识别引擎,也支持唤醒功能。它是一个免费、开源的软件,支持多种语言的开发和使用,包括C、Python、Java、Ruby等。但需要注意的是,Pocketsphinx的唤醒功能需要使用GStreamer进行语音流的处理,配置起来可能比较复杂。github地址:https://github.com/cmusphinx/pocketsphinx
Porcupine:是由Picovoice开发的一个语音唤醒引擎,支持多种语言和多个操作系统平台。Porcupine使用深度神经网络来进行唤醒识别,支持离线唤醒,也可以在云端进行识别。githb地址:https://github.com/Picovoice/rhino
Snips:是一个基于Rust语言开发的私有化语音助手解决方案,也支持语音唤醒功能。Snips支持多语言,其中包括中文,并提供了多个开源工具包和库,可以帮助开发者进行语音识别和唤醒功能的集成。官网:https://snips.ai/
需要注意的是,以上这些语音识别唤醒库都有其特定的使用场景和限制,用户需要根据具体需求选择适合自己的工具库。同时,使用这些库也需要一定的技术储备和经验,因此建议用户在使用前进行充分的学习和实践。
网友回复
腾讯混元模型广场里都是混元模型的垂直小模型,如何api调用?
为啥所有的照片分辨率提升工具都会修改照片上的图案细节?
js如何在浏览器中将webm视频的声音分离为单独音频?
微信小程序如何播放第三方域名url的mp4视频?
ai多模态大模型能实时识别视频中的手语为文字吗?
如何远程调试别人的chrome浏览器获取调试信息?
为啥js打开新网页window.open设置窗口宽高无效?
浏览器中js的navigator.mediaDevices.getDisplayMedia屏幕录像无法录制SpeechSynthesisUtterance产生的说话声音?
js中mediaRecorder如何录制window.speechSynthesis声音音频并下载?
python如何直接获取抖音短视频的音频文件url?