搜索

回答

离线首选wisper，但是在线的话可以选recognize_google

要使用 recognize_google 从麦克风和音频文件识别中文，可以使用 Python 的 SpeechRecognition 库。下面是分别从麦克风和音频文件识别中文的代码示例。

安装 SpeechRecognition 库

首先，确保安装了 SpeechRecognition 库和 pyaudio 库（用于麦克风输入）：

pip install SpeechRecognition pyaudio

从麦克风识别中文

以下代码从麦克风获取音频并识别其中的中文：

import speech_recognition as sr

def recognize_from_microphone():
    # 创建识别器
    recognizer = sr.Recognizer()

    with sr.Microphone() as source:
        print("请说话...")
        # 调整麦克风的噪声水平
        recognizer.adjust_for_ambient_noise(source)
        # 录制音频
        audio = recognizer.listen(source)

    try:
        # 使用 Google API 识别中文
        text = recognizer.recognize_google(audio, language='zh-CN')
        print("识别结果：", text)
    except sr.UnknownValueError:
        print("无法识别音频")
    except sr.RequestError:
        print("无法请求结果，请检查网络连接")

# 调用函数
recognize_from_microphone()

从音频文件识别中文

以下代码从音频文件中识别中文：

import speech_recognition as sr

def recognize_from_audio_file(file_path):
    # 创建识别器
    recognizer = sr.Recognizer()

    # 加载音频文件
    with sr.AudioFile(file_path) as source:
        # 读取音频文件数据
        audio = recognizer.record(source)

    try:
        # 使用 Google API 识别中文
        text = recognizer.recognize_google(audio, language='zh-CN')
        print("识别结果：", text)
    except sr.UnknownValueError:
        print("无法识别音频")
    except sr.RequestError:
        print("无法请求结果，请检查网络连接")

# 调用函数，替换为你的音频文件路径
recognize_from_audio_file('你的音频文件路径.wav')

注意事项网络连接：recognize_google 需要连接到互联网，因为识别过程是在 Google 的服务器上进行的。音频质量：确保麦克风或音频文件的质量良好，以提高识别的准确性。文件格式：音频文件需要是 WAV 格式，其他格式可能需要先转换。

通过上述方法，你可以分别从麦克风和音频文件中识别中文语音。

网友回复

我知道答案，我要回答

我有问题

回答

win10上powershell运行wsl报错Wsl/0x80072f7d如何解决？

人工智能技术属于科学范畴吗？

pi与claw及codex有啥不同？

有没有在电脑上运行iphone虚拟机的软件？

如何将电脑扬声器声音同步输出到另外一台手机或电脑上/

为啥图片和视频大模型的提示词支持json和python代码？

Chromium的 Kiosk 模式是干啥的？

豆包如何生成15秒以上的视频？

ai文本大模型最后会升级成做任何动画片吗？

python有没有一键扒谱和音乐背景旋律与人声分离的库？