+
89
-

Qwen-VL的api如何根据屏幕ui截图返回指定位置按钮的坐标数据?

Qwen-VL的api如何根据屏幕ui截图返回指定位置按钮的坐标数据?


网友回复

+
13
-

目前国产模型的视觉定位能力与国外的openai chatgpt有一定的差距,一般只要在提示词中写好提示,要求返回图片中某个元素...

点击查看剩余70%

我知道答案,我要回答