为啥qwen-vl-max与qwen-vl-plus回答图片问题更好?
同样一个数学题,使用qwen-vl-max与qwen-vl-plus给出的答案天差地别
这个是孩子完成的数学题,通过api分别调用qwen-vl-max与qwen-vl-plus,发现plus好像答非所问,但是max会按照你的要求完成
你是一位经验丰富的数学教师,负责帮助学生批改作业,并提供详细的解析。对于每一份作业,请按照以下步骤进行处理: 1. **审阅作业**:仔细阅读学生的作业内容。 2. **评分与反馈**: - 对于每个题目,明确指出答案是否正确。 - 如果答案错误,请给出正确的答案以及解题思路或方法。 3. **统计成绩**:计算并记录学生答对的题目数量和答错的题目数量。 4. **总结建议**:基于本次作业的表现,为学生提出改进学习方法的具体建议。 请确保你的反馈既具体又具有建设性,旨在帮助学生理解其错误所在,并鼓励他们继续努力提高。plus回答
Array ( [choices] => Array ( [0] => Array ( [message] => Array ( [content] => 由于图片中的文字是中文且较为复杂,我将尽力根据提供的信息为你解答。 这张图显示了两页练习册的内容,包括一些算术问题的答案及解释: 第一页: - 第一个问题是求两个分数相加的结果。 - 第二个问题是减去一个小数(0.5)乘以另一个小数(67/100),结果保留两位小数。 - 第三个问题是要求出正方形面积的一半。 - 最后一个问题是一个复杂的混合运算表达式,需要先做除法再做乘法。 第二页: - 这些问题涉及到负数、百分比等概念的应用。 - 首先是读取温度值的问题,其中零下表示要从数值中减掉绝对值;收入和支出则涉及到了正负号的变化规则。 - 接下来是一系列关于比例关系的问题,如超过多少米记作什么符号等等。 - 地上地下层数的关系也包含在内。 为了更好地回答您的问题,如果您能提供更多细节或者具体的疑问点,我会更乐意为您提供深入的帮助。 [role] => assistant ) [finish_reason] => stop [index] => 0 [logprobs] => ) ) [object] => chat.completion [usage] => Array ( [prompt_tokens] => 493 [completion_tokens] => 229 [total_tokens] => 722 ) [created] => 1735910741 [system_fingerprint] => [model] => qwen-vl-plus [id] => chatcmpl-0c8fd6bc-0640-96ea-bfb9-b913b9de2851 )
max回答
Array ( [choices] => Array ( [0] => Array ( [message] => Array ( [content] => 根据你提供的作业内容,我将逐一审阅并给出详细的解析和建议。 ### 第1片 1. \( \frac{1}{3} + \frac{1}{6} = \frac{1}{2} \) - 正确。解题思路:通分后相加。 2. \( \frac{1}{2} - \frac{1}{4} = \frac{1}{4} \) - 正确。解题思路:通分后相减。 3. \( 5 \times \frac{1}{6} = \frac{5}{6} \) - 正确。解题思路:直接乘法。 4. \( \frac{1}{2} \div 3 = \frac{1}{6} \) - 正确。解题思路:除以一个数等于乘以它的倒数。 5. \( \frac{6}{7} \times \frac{1}{3} = \frac{2}{7} \) - 正确。解题思路:分子相乘,分母相乘。 6. \( \frac{5}{7} \times 14 = 10 \) - 正确。解题思路:分数乘以整数,分子乘以整数。 7. \( 6 \div \frac{1}{2} = 12 \) - 正确。解题思路:除以一个分数等于乘以它的倒数。 8. \( \frac{3}{10} \div 9 = \frac{1}{30} \) - 正确。解题思路:除以一个数等于乘以它的倒数。 9. \( 0.4 \times 0.4 \times \frac{1}{8} = 0.02 \) - 正确。解题思路:直接计算。 10. \( 1.4 \div \frac{1}{5} \times 5 = 35 \) - 正确。解题思路:先除以分数,再乘以整数。 11. \( 7.2 \div \frac{8}{9} - 7.2 \times \frac{8}{9} = 1.7 \) - 错误。正确答案:\( 7.2 \div \frac{8}{9} - 7.2 \times \frac{8}{9} = 8.1 - 6.4 = 1.7 \) ### 第2片 1. 读出下面的数。 - -5.2 读作(负五点二) - +41 读作(正四十一) - -\(\frac{1}{9}\) 读作(负九分之一) - +\(\frac{3}{8}\) 读作(正八分之三) - 0.067 读作(零点零六七) - -0.012 读作(负零点零一二) 2. 用正、负数表示下列各数。 - 零下0.5℃ 记作(-0.5)℃ - 零上25℃ 记作(+25)℃ - 收入1040元记作(+1040)元 - 支出5000元记作(-5000)元 - 超过15米记作(+15)米 - 还差1.5米记作(-1.5)米 - 地上2层记作(+2)层 - 地下2层记作(-2)层 - 盈利200元记作(+200)元 - 亏本500元记作(-500)元 ### 统计成绩 - 答对题目数量:10 - 答错题目数量:1 ### 总结建议 - 你的大部分题目都答对了,表现非常好! - 在第11题中,注意运算顺序和符号的处理。 - 继续保持良好的学习习惯,多做练习,巩固基础。 [role] => assistant ) [finish_reason] => stop [index] => 0 [logprobs] => ) ) [object] => chat.completion [usage] => Array ( [prompt_tokens] => 488 [completion_tokens] => 966 [total_tokens] => 1454 ) [created] => 1735910780 [system_fingerprint] => [model] => qwen-vl-max [id] => chatcmpl-c3c6237e-99a7-9720-bf00-4f77af54a220 )
难道是max比plus贵,所以plus降智了?
网友回复
Qwen-VL-Max 和 Qwen-VL-Plus 是阿里云通义千问系列中的两款视觉语言模型(VLMs),它们在性能、适用场景和成本等方面存在显著差异。以下是两者的详细对比:
1. 性能与能力Qwen-VL-Max
这是通义千问系列中性能最强的视觉语言模型,专为复杂任务设计,具备更高的视觉推理和指令遵循能力。支持更高分辨率的图像处理(如百万像素以上)和极端长宽比的图片,能够处理更复杂的视觉任务,如文档分析、图表理解和多语言OCR。在多项基准测试中(如MMMU、MathVista、DocVQA等)表现优异,超越GPT-4V和Gemini等国际领先模型。Qwen-VL-Plus
性能介于Qwen-VL-Max和基础版之间,适合中等复杂度的任务。在细节识别和文字识别能力上有显著提升,支持超百万像素分辨率和任意宽高比的图像。...点击查看剩余70%