先按正常的语速生成声音,然后使用ffmpeg对生成的声音进行变速不变调处理,示例代码:
import subprocess def change_speed_ffmpeg(input_file, output_file, target_duration): """ 使用 ffmpeg 实现变速不变调,并控制在指定时间内播放。 :param input_file: 输入音频文件路径 :param output_file: 输出音频文件路径 :param target_duration: 目标时长(秒) """ # 计算变速比例 current_duration = float(subprocess.check_output( f"ffprobe -i {input_file} -show_entries format=duration -v quiet -of csv='p=0'", shell=True )) speed_factor = current_duration / target_duration # 使用 ffmpeg 变速不变调 command = f"ffmpeg -i {input_file} -filter:a 'atempo={speed_factor}' {output_file}" subprocess.call(command, shell=True) print(f"音频已处理,目标时长: {target_duration} 秒,输出文件: {output_file}") # 示例调用 input_file = "input.wav" # 输入音频文件 output_file = "output_ffmpeg.wav" # 输出音频文件 target_duration = 5 # 目标时长(秒) change_speed_ffmpeg(input_file, output_file, target_duration)
网友回复
js如何在浏览器中将一段音频生成带频谱和自定义图片的有声视频?
ai大模型微调为啥说被Agentic 上下文工程(ACE)技术替代了?
如何把ESP+继电器将自家的插座改造成手机远程开关控制?
安卓手机如何虚拟运行windows10及linux操作系统?
python如何利用ai自动在千牛监听和回复用户消息促成用户下单购买?
ai如何自动监听和回复咸鱼的消息?
如何解决three的三维场景CSS3DObject中iframe穿透一切问题呢?
有没有哪个ai人工智能动态生成鲜活带表情肢体动作逼真数字人与人类交流视频聊天?
threejs如何将iframe与video作为立方体模型一面的材质可点击交互?
UEFI与Legacy启动有啥不同?