可以用openai的最gpt-image-1或者google的gemini的api实现
我们以免费的gemini api为例来实现:
+
让左面美女的手中拿的盒子变成吹分机
点击查看全文
from google import genai from google.genai import types from PIL import Image from io import BytesIO # import PIL.Image image1 = PIL.Image.open('prod2.png') image2 = PIL.Image.open('prod3.png') client = genai.Client(api_key="apikey") text_input = ('更新图片:图片1中的人物手中拿的物品更换成图片2,并保持整体协调') response = client.models.generate_content( model="gemini-2.0-flash-exp-image-generation", contents=[text_input, image1,image2], config=types.GenerateContentConfig( response_modalities=['TEXT', 'IMAGE'] ) ) for part in response.candidates[0].content.parts: if part.text is not None: print(part.text) elif part.inline_data is not None: image = Image.open(BytesIO(part.inline_data.data)) image.show()
网友回复
如何编写一个chrome插件实现多线程高速下载大文件?
cdn版本的vue在网页中出现typeerror错误无法找到错误代码位置怎么办?
pywebview能否使用webrtc远程控制共享桌面和摄像头?
pywebview6.0如何让窗体接受拖拽文件获取真实的文件路径?
如何在linux系统中同时能安装运行apk的安卓应用?
python有没有离线验证码识别ocr库?
各家的ai图生视频及文生视频的api价格谁最便宜?
openai、gemini、qwen3-vl、Doubao-Seed-1.6在ui截图视觉定位这款哪家更强更准?
如何在linux上创建一个沙箱隔离的目录让python使用?
pywebview如何使用浏览器自带语音识别与webspeech 的api?