+
56
-

全球顶尖大模型这么强,为啥AGI 测试集体溃败 人类满分 AI 最高仅 0.37%?

全球顶尖大模型这么强,为啥AGI 测试集体溃败 人类满分 AI 最高仅 0.37%?

网友回复

+
23
-

现在的 AI 都是 “超级做题家”,但 ARC-AGI-3 考的是 “荒野求生”。人类天生会,AI 完全不会。

一、先讲清:这是什么测试?(ARC-AGI-3)

不是考试,是 “盲玩游戏”:150 多个全新小游戏,没规则、没教程、没目标、没提示。

人类:随便来个普通人,玩几分钟就摸清规律,100% 通关。

AI(GPT-5、Gemini 3.1 等):最强的才 0.37%,基本等于 “完全玩不明白”。

二、AI 为啥这么拉胯?(3 个根本原因)

...

点击查看剩余70%

我知道答案,我要回答