离线首选wisper,但是在线的话可以选recognize_google
要使用 recognize_google 从麦克风和音频文件识别中文,可以使用 Python 的 SpeechRecognition 库。下面是分别从麦克风和音频文件识别中文的代码示例。
安装 SpeechRecognition 库首先,确保安装了 SpeechRecognition 库和 pyaudio 库(用于麦克风输入):
pip install SpeechRecognition pyaudio从麦克风识别中文
以下代码从麦克风获取音频并识别其中的中文:
import speech_recognition as sr
def recognize_from_microphone():
# 创建识别器
recognizer = sr.Recognizer()
with sr.Microphone() as source:
print("请说话...")
# 调整麦克风的噪声水平
recognizer.adjust_for_ambient_noise(source)
# 录制音频
audio = recognizer.listen(source)
try:
# 使用 Google API 识别中文
text = recognizer.recognize_google(audio, language='zh-CN')
print("识别结果:", text)
except sr.UnknownValueError:
print("无法识别音频")
except sr.RequestError:
print("无法请求结果,请检查网络连接")
# 调用函数
recognize_from_microphone() 从音频文件识别中文以下代码从音频文件中识别中文:
import speech_recognition as sr
def recognize_from_audio_file(file_path):
# 创建识别器
recognizer = sr.Recognizer()
# 加载音频文件
with sr.AudioFile(file_path) as source:
# 读取音频文件数据
audio = recognizer.record(source)
try:
# 使用 Google API 识别中文
text = recognizer.recognize_google(audio, language='zh-CN')
print("识别结果:", text)
except sr.UnknownValueError:
print("无法识别音频")
except sr.RequestError:
print("无法请求结果,请检查网络连接")
# 调用函数,替换为你的音频文件路径
recognize_from_audio_file('你的音频文件路径.wav') 注意事项网络连接:recognize_google 需要连接到互联网,因为识别过程是在 Google 的服务器上进行的。音频质量:确保麦克风或音频文件的质量良好,以提高识别的准确性。文件格式:音频文件需要是 WAV 格式,其他格式可能需要先转换。通过上述方法,你可以分别从麦克风和音频文件中识别中文语音。
网友回复
有没有不依赖embedding向量的RAG技术?
有没有支持实时打断语音通话并后台帮你执行任何的ai模型?
开源ai大模型文件格式GGUF、MLX、Safetensors、 ONNX 有什么区别?
出海挣钱支付收款PayPal、Wise 、PingPong、Stripe如何选择?
如何实现类似google的图片隐形水印添加和识别技术?
linux上如何运行任意windows程序?
ai能写出比黑客还厉害的零日漏洞等攻击工具攻击任意软件系统工程?
js如何获取浏览器的音频上下文指纹、Canvas指纹、WebGL渲染特征?
为啥ai开始抛弃markdown文本,重新偏好html文本了?
网站有没有办法鉴别访问请求是由ai操控chrome-devtools-mcp发出的?


