搜索

python有没有好用的离线音频转文字的库？

python 音视频

可以将音频文件识别文字内容转换成文本？

网友回复

openai开源的Whisper就能识别世界上大部分国家的说话声音转换成文本，可以离线部署使用，开源地址：https://github.com/op...

点击查看剩余70%

by python

离线首选wisper，但是在线的话可以选recognize_google

要使用 recognize_google 从麦克风和音频文件识别中文，可以使用 Python 的 SpeechRecognition 库。下面是分别从麦克风和音频文件识别中文的代码示例。

安装 SpeechRecognition 库

首先，确保安装了 SpeechRecognition 库和 pyaudio 库（用于麦克风输入）：

pip install SpeechRecognition pyaudio

从麦克风识别中文

以下代码从麦克风获取音频并识别其中的中文：

import speech_recognition as sr

def recognize_from_microphone():
    # 创建识别器
    recognizer = sr.Recognizer()

    with sr.Microphone() as source:
        print("请说话...")
        # 调整麦克风的噪声水平
        recognizer.adjust_for_ambient_noise(source)
        # 录制音频...

点击查看剩余70%

by thinkfuture

参考点击打开链接

by python

我知道答案，我要回答

我有问题

python有没有好用的离线音频转文字的库？

kimi-k3与qwen-3.8及deepseek-v4正式版到底哪个更强？

veo与哦Omni免费体验网站哪有？

gemini免费api可以使用哪些模型和限制？

抖音版权中心提交的短剧被人搬运到其他平台如何维权？

大模型越来越像loop agent了，越来越耗时了

win10上powershell运行wsl报错Wsl/0x80072f7d如何解决？

人工智能技术属于科学范畴吗？

pi与claw及codex有啥不同？

有没有在电脑上运行iphone虚拟机的软件？

如何将电脑扬声器声音同步输出到另外一台手机或电脑上/