如何使用ai接口写一个实时视频面试助手帮你回答面试问题?
可以语音识别面试官的问题并给出文字回答。
网友回复
首先明确需求和操作步骤,应用必须要实时监听获取面试官的提问,然后手动确认问题调用大模型api流式输出,这里面第一个技术是实时获取面试官的语音问题转成文字,这里推荐使用开源的whisper-large-v3-turbo
使用/whisper-large-v3-turbo实时获取说话者的文本后再点击确认调用ai大模型的api即可实现
import torch from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, pipeline from datasets import load_dataset device = "cuda:0" if torch.cuda.is_available() else "cpu" torch_dtype = torch.float16 if torch.cud...
点击查看剩余70%