搜索

回答

还真有人用大模型测试高考题，看看各大ai大模型的表现：

2024 年 6 月 7 日，全国高考开始。搜狐科技和搜狐教育联合测评了 10 款 AI 大模型在高考数学科目的表现。

这些模型包括 ChatGPT-4o、阿里通义、字节豆包、百度文心一言、腾讯元宝、讯飞星火、智谱清言、月之暗面 Kimi、百川百小应和 MiniMax 海螺 AI。

测试采用了新课标 I 卷的前 8 道单选题，以图片形式输入，除了豆包以文档形式输入。

结果显示，百度文心一言、字节豆包和讯飞星火的正确率最高，均为 63%；阿里通义和智谱清言的正确率为 50%；ChatGPT-4o 和 MiniMax 海螺 AI 的正确率为 38%；腾讯元宝、月之暗面 Kimi 和百川百小应的正确率最低，仅为 25%。整体而言，今年的平均正确率为 44%，显著高于去年的 26%，表明大模型在数学能力上有较大提升。

800_auto

此外，今年还测试了大模型的多模态能力，发现即使能够识别题目，其答题能力仍有待加强。在高考作文测试中，ChatGPT-4o 和腾讯元宝表现较好，分别排名第一和第二。

网友回复

我知道答案，我要回答

我有问题

回答

win10上powershell运行wsl报错Wsl/0x80072f7d如何解决？

人工智能技术属于科学范畴吗？

pi与claw及codex有啥不同？

有没有在电脑上运行iphone虚拟机的软件？

如何将电脑扬声器声音同步输出到另外一台手机或电脑上/

为啥图片和视频大模型的提示词支持json和python代码？

Chromium的 Kiosk 模式是干啥的？

豆包如何生成15秒以上的视频？

ai文本大模型最后会升级成做任何动画片吗？

python有没有一键扒谱和音乐背景旋律与人声分离的库？