以下是几个开源的中文语音识别唤醒库:
Snowboy:是由KITT.AI开发的一个基于神经网络的语音唤醒库,支持离线识别,可以在嵌入式设备上运行。它提供了Python、C++、Java、Node.js等多种语言的API,也提供了针对Raspberry Pi等嵌入式设备的定制版本。github地址:https://github.com/Kitt-AI/snowboyPocketsphinx:是CMU Sphinx开发的一个语音识别引擎,也支持唤醒功能。它是一个免费、开源的软件,支持多种语言的开发和使用,包括C、Python、Java、Ruby等。但需要注意的是,Pocketsphinx的唤醒功能需要使用GStreamer进行语音流的处理,配置起来可能比较复杂。github地址:https://github.com/cmusphinx/pocketsphinx
Porcupine:是由Picovoice开发的一个语音唤醒引擎,支持多种语言和多个操作系统平台。Porcupine使用深度神经网络来进行唤醒识别,支持离线唤醒,也可以在云端进行识别。githb地址:https://github.com/Picovoice/rhino
Snips:是一个基于Rust语言开发的私有化语音助手解决方案,也支持语音唤醒功能。Snips支持多语言,其中包括中文,并提供了多个开源工具包和库,可以帮助开发者进行语音识别和唤醒功能的集成。官网:https://snips.ai/
需要注意的是,以上这些语音识别唤醒库都有其特定的使用场景和限制,用户需要根据具体需求选择适合自己的工具库。同时,使用这些库也需要一定的技术储备和经验,因此建议用户在使用前进行充分的学习和实践。
网友回复
阿里云ESA、cloudflare worker、腾讯云EdgeOne网站代理托管哪家更好?
剪映能打开.fcpxml格式的文件吗?
增量式编码器与绝对式编码器的区别是啥?
有没有开源的单张照片或者序列帧图片或视频就能重建4d场景动画项目?
chrome网页突然报错:错误代码:RESULT_CODE_KILLED_BAD_MESSAGE
openai的codex如何全程无需手动确认自动修改文件?
阿里云oss前端上传文件直传如何限制文件类型?
阿里云oss前端获取policy签名直传oss上传文件回调如何传?
如何将根据三维物体通过提示词变成可交互的4d场景动画?
浏览器中实时摄像头离线视觉ai模型有吗?


