离线首选wisper,但是在线的话可以选recognize_google
要使用 recognize_google 从麦克风和音频文件识别中文,可以使用 Python 的 SpeechRecognition 库。下面是分别从麦克风和音频文件识别中文的代码示例。
安装 SpeechRecognition 库首先,确保安装了 SpeechRecognition 库和 pyaudio 库(用于麦克风输入):
pip install SpeechRecognition pyaudio从麦克风识别中文
以下代码从麦克风获取音频并识别其中的中文:
import speech_recognition as sr def recognize_from_microphone(): # 创建识别器 recognizer = sr.Recognizer() with sr.Microphone() as source: print("请说话...") # 调整麦克风的噪声水平 recognizer.adjust_for_ambient_noise(source) # 录制音频 audio = recognizer.listen(source) try: # 使用 Google API 识别中文 text = recognizer.recognize_google(audio, language='zh-CN') print("识别结果:", text) except sr.UnknownValueError: print("无法识别音频") except sr.RequestError: print("无法请求结果,请检查网络连接") # 调用函数 recognize_from_microphone()从音频文件识别中文
以下代码从音频文件中识别中文:
import speech_recognition as sr def recognize_from_audio_file(file_path): # 创建识别器 recognizer = sr.Recognizer() # 加载音频文件 with sr.AudioFile(file_path) as source: # 读取音频文件数据 audio = recognizer.record(source) try: # 使用 Google API 识别中文 text = recognizer.recognize_google(audio, language='zh-CN') print("识别结果:", text) except sr.UnknownValueError: print("无法识别音频") except sr.RequestError: print("无法请求结果,请检查网络连接") # 调用函数,替换为你的音频文件路径 recognize_from_audio_file('你的音频文件路径.wav')注意事项网络连接:recognize_google 需要连接到互联网,因为识别过程是在 Google 的服务器上进行的。音频质量:确保麦克风或音频文件的质量良好,以提高识别的准确性。文件格式:音频文件需要是 WAV 格式,其他格式可能需要先转换。
通过上述方法,你可以分别从麦克风和音频文件中识别中文语音。
网友回复
为啥所有的照片分辨率提升工具都会修改照片上的图案细节?
js如何在浏览器中将webm视频的声音分离为单独音频?
微信小程序如何播放第三方域名url的mp4视频?
ai多模态大模型能实时识别视频中的手语为文字吗?
如何远程调试别人的chrome浏览器获取调试信息?
为啥js打开新网页window.open设置窗口宽高无效?
浏览器中js的navigator.mediaDevices.getDisplayMedia屏幕录像无法录制SpeechSynthesisUtterance产生的说话声音?
js中mediaRecorder如何录制window.speechSynthesis声音音频并下载?
python如何直接获取抖音短视频的音频文件url?
js在浏览器中如何使用MediaStream与MediaRecorder实现声音音频多轨道混流?