以下是几个开源的中文语音识别唤醒库:
Snowboy:是由KITT.AI开发的一个基于神经网络的语音唤醒库,支持离线识别,可以在嵌入式设备上运行。它提供了Python、C++、Java、Node.js等多种语言的API,也提供了针对Raspberry Pi等嵌入式设备的定制版本。github地址:https://github.com/Kitt-AI/snowboyPocketsphinx:是CMU Sphinx开发的一个语音识别引擎,也支持唤醒功能。它是一个免费、开源的软件,支持多种语言的开发和使用,包括C、Python、Java、Ruby等。但需要注意的是,Pocketsphinx的唤醒功能需要使用GStreamer进行语音流的处理,配置起来可能比较复杂。github地址:https://github.com/cmusphinx/pocketsphinx
Porcupine:是由Picovoice开发的一个语音唤醒引擎,支持多种语言和多个操作系统平台。Porcupine使用深度神经网络来进行唤醒识别,支持离线唤醒,也可以在云端进行识别。githb地址:https://github.com/Picovoice/rhino
Snips:是一个基于Rust语言开发的私有化语音助手解决方案,也支持语音唤醒功能。Snips支持多语言,其中包括中文,并提供了多个开源工具包和库,可以帮助开发者进行语音识别和唤醒功能的集成。官网:https://snips.ai/
需要注意的是,以上这些语音识别唤醒库都有其特定的使用场景和限制,用户需要根据具体需求选择适合自己的工具库。同时,使用这些库也需要一定的技术储备和经验,因此建议用户在使用前进行充分的学习和实践。
网友回复
有没有不依赖embedding向量的RAG技术?
有没有支持实时打断语音通话并后台帮你执行任何的ai模型?
开源ai大模型文件格式GGUF、MLX、Safetensors、 ONNX 有什么区别?
出海挣钱支付收款PayPal、Wise 、PingPong、Stripe如何选择?
如何实现类似google的图片隐形水印添加和识别技术?
linux上如何运行任意windows程序?
ai能写出比黑客还厉害的零日漏洞等攻击工具攻击任意软件系统工程?
js如何获取浏览器的音频上下文指纹、Canvas指纹、WebGL渲染特征?
为啥ai开始抛弃markdown文本,重新偏好html文本了?
网站有没有办法鉴别访问请求是由ai操控chrome-devtools-mcp发出的?


