网友回复
步骤:
1. 提取PPT中的文本和图片2. 使用Google Text-to-Speech生成语音3. 为每页PPT创建视频片段4. 自动排版图片和文字5. 合成最终视频
参考代码:
from pptx import Presentation
from moviepy.editor import ImageClip, TextClip, CompositeVideoClip, concatenate_videoclips, AudioFileClip
from gtts import gTTS
import os
import tempfile
import shutil
class PPTVideoGenerator:
def __init__(self,
ppt_path: str,
output_path: str,
slide_duration: float = 5.0,
language: str = 'zh-cn',
size: tuple = (1920, 1080)):
"""
初始化PPT视频生成器
Args:
ppt_path: PPT文件路径
output_path: 输出视频路径
slide_duration: 每页PPT的默认时长(秒)
language: 文字转语音的语言
size: 视频尺寸
"""
self.ppt_path = ppt_path
self.output_path = output_path
self.slide_duration = slide_duration
self.language = language
self.size = size
self.temp_dir = tempfile.mkdtemp()
def extract_slide_content(self, slide):
"""提取幻灯片中的文本和图片"""
texts = []
images = []
# 提取文本
for shape in slide.shapes:
if hasattr(shape, "text"):
if shape.text.strip():
texts.append(shape.text.strip())
# 提取图片
if shape.shape_type == 13: # MSO_SHAPE_TYPE.PICTURE
image_path = os.path.join(self.temp_dir, f"image_{len(images)}.png")
with open(image_path, 'wb') as f:
f.write(shape.image.blob)
images.append(image_path)
return texts, images
def create_slide_video(self, texts: list, images: list, audio_pat...点击查看剩余70%
为什么主流大模型架构都在用MoE,而不是传统的Dense?
js如何将图片转换成拼豆图案风格?
ai能接管电脑手机写作剪辑视频自主运营自媒体账号为用户赚钱吗?
python+qwen的api如何实现类似skills的技能创建与自主调用?
python+openai兼容api如何实现自主调用浏览器搜索登录发布信息?
安卓手机投屏电视视频播放结束如何自动播放下一集?
PaddleOCR-VL-1.5与deepseek ocr2谁更好?
电商系统中优惠券规则引擎与组合优惠如何设计避免在代码中重复使用ifelse?
Grok Imagine Video这个ai能根据用户文本指令编辑视频吗?
Openai的Prism到底是啥?


