两种方式:
实现方式一:先下载再提取(推荐)
import requests
from moviepy.editor import VideoFileClip
import os
def download_video(url, output_path):
print("开始下载视频...")
response = requests.get(url, stream=True)
with open(output_path, 'wb') as f:
for chunk in response.iter_content(chunk_size=1024 * 1024):
if chunk:
f.write(chunk)
print("视频下载完成")
return output_path
def extract_audio(video_path, audio_output_path):
print("开始提取音频...")
video = VideoFileClip(video_path)
audio = video.audio
audio.write_audiofile(audio_output_path)
print("音频保存完成")
# 清理资源
video.close()
audio.close()
# 示例使用
video_url = "https://example.com/video.mp4" # 替换为你的MP4在线地址
local_video_file = "temp_video.mp4"
local_audio_file = "output_audio.mp3"
download_video(video_url, local_video_file)
extract_audio(local_video_file, local_audio_file)
# 可选:清理临时视频文件
os.remove(local_video_file)
print("临时视频文件已删除") 实现方式二:流式处理(无需完整下载)
虽然 moviepy 本身不支持直接从 URL 流式读取,但可以通过 http + ffmpeg 命令行调用实现更高效的处理。
使用 ffmpeg 命令行流式提取(推荐用于大文件)
ffmpeg -i "https://example.com/video.mp4" -vn -acodec libmp3lame output_audio.mp3
你也可以在 Python 中调用这个命令:
import subprocess
video_url = "https://example.com/video.mp4"
audio_output = "output_audio.mp3"
cmd = [
"ffmpeg",
"-i", video_url,
"-vn", # 不处理视频
"-acodec", "libmp3lame", # 音频编码器
audio_output
]
print("开始提取音频...")
subprocess.run(cmd)
print("音频提取完成")
网友回复
有没有不依赖embedding向量的RAG技术?
有没有支持实时打断语音通话并后台帮你执行任何的ai模型?
开源ai大模型文件格式GGUF、MLX、Safetensors、 ONNX 有什么区别?
出海挣钱支付收款PayPal、Wise 、PingPong、Stripe如何选择?
如何实现类似google的图片隐形水印添加和识别技术?
linux上如何运行任意windows程序?
ai能写出比黑客还厉害的零日漏洞等攻击工具攻击任意软件系统工程?
js如何获取浏览器的音频上下文指纹、Canvas指纹、WebGL渲染特征?
为啥ai开始抛弃markdown文本,重新偏好html文本了?
网站有没有办法鉴别访问请求是由ai操控chrome-devtools-mcp发出的?


