网友回复
1、python语音识别可以使用speech_recognition
安装pip install speech_recognition
识别代码:
# -*- coding: utf-8 -*- # /usr/bin/python import speech_recognition as sr r = sr.Recognizer() #调用识别器 test = sr.AudioFile("/data/wwwroot/default/asset/voice.flac") #导入语音文件 with test as source: audio = r.record(source) type(audio) c=r.recognize_sphinx(audio, language='zh-cn') #识别输出 print(c)注意:pocketsphinx需要安装的中文语言、声学模型
下载地址:ht...
点击查看剩余70%
还可以使用微软的文字转语音服务,支持140种语言,声音非常接近人声
import asyncio from msspeech import MSSpeech async def main(): mss = MSSpeech() print("Geting voices...") voices = await mss.get_voices_list() print("人工智能是未来") for voice in voices: if voice["Loca...
点击查看剩余70%
为啥浏览器中js请求gemini兼容openai的api出现断句?
如何让ai生成漂亮流程图?
cloudflare的ai gateway中如何使用兼容openai方式访问gemini,baseurl是什么?
vue3的cdn版本html如何动态载入vue组件运行?
python如何使用fastapi搭建一个大模型流式输出api?
python如何使用BFF(Backend for Frontend) + HttpOnlyCookie技术实现jwt认证?
google的veo3ai生成视频模型在哪可以白嫖?
ai如何克隆别人的音色根据歌词唱指定风格的音乐?
ai如何学习歌曲一段声音进行续唱生成完整歌曲?
css如何结合svg实现各种文字效果?