+
102
-

python有没有好用的离线音频转文字的库?

python有没有好用的离线音频转文字的库?

可以将音频文件识别文字内容转换成文本?

网友回复

+
24
-

openai开源的Whisper就能识别世界上大部分国家的说话声音转换成文本,可以离线部署使用,开源地址:https://github.com/op...

点击查看剩余70%

+
18
-

离线首选wisper,但是在线的话可以选recognize_google 

要使用 recognize_google 从麦克风和音频文件识别中文,可以使用 Python 的 SpeechRecognition 库。下面是分别从麦克风和音频文件识别中文的代码示例。

安装 SpeechRecognition 库

首先,确保安装了 SpeechRecognition 库和 pyaudio 库(用于麦克风输入):

pip install SpeechRecognition pyaudio
从麦克风识别中文

以下代码从麦克风获取音频并识别其中的中文:

import speech_recognition as sr

def recognize_from_microphone():
    # 创建识别器
    recognizer = sr.Recognizer()

    with sr.Microphone() as source:
        print("请说话...")
        # 调整麦克风的噪声水平
        recognizer.adjust_for_ambient_noise(source)
        # 录制音频...

点击查看剩余70%

我知道答案,我要回答