python有没有好用的离线音频转文字的库?
可以将音频文件识别文字内容转换成文本?
网友回复
openai开源的Whisper就能识别世界上大部分国家的说话声音转换成文本,可以离线部署使用,开源地址:https://github.com/op...
点击查看剩余70%
离线首选wisper,但是在线的话可以选recognize_google
要使用 recognize_google 从麦克风和音频文件识别中文,可以使用 Python 的 SpeechRecognition 库。下面是分别从麦克风和音频文件识别中文的代码示例。
安装 SpeechRecognition 库首先,确保安装了 SpeechRecognition 库和 pyaudio 库(用于麦克风输入):
pip install SpeechRecognition pyaudio从麦克风识别中文
以下代码从麦克风获取音频并识别其中的中文:
import speech_recognition as sr
def recognize_from_microphone():
# 创建识别器
recognizer = sr.Recognizer()
with sr.Microphone() as source:
print("请说话...")
# 调整麦克风的噪声水平
recognizer.adjust_for_ambient_noise(source)
# 录制音频...点击查看剩余70%
claude mythos这么厉害为啥不公开发布给所有人使用?
linux stream如何限制单个目录最大容量?
哪有免费的千问qwen3.6-plus的api可以使用?
python如何自动根据视频图片等素材自动按照要求剪辑视频生成剪映草稿?
gemma4与开源的qwen3.5哪个更厉害?
wan2.7 video与seedance2哪个更好?
claude code 51万行代码泄露被迫开源在哪能找到源码?
有没有免费的虚拟局域网工具可以将互联网设备组成一个大的局域网?
全球顶尖大模型这么强,为啥AGI 测试集体溃败 人类满分 AI 最高仅 0.37%?
听说字节seedance3的视频生成长度可达到10分钟?


