搜索

+

86

-

全球顶尖大模型这么强，为啥AGI 测试集体溃败人类满分 AI 最高仅 0.37%？

人工智能

全球顶尖大模型这么强，为啥AGI 测试集体溃败人类满分 AI 最高仅 0.37%？

网友回复

+

23

-

现在的 AI 都是 “超级做题家”，但 ARC-AGI-3 考的是 “荒野求生”。人类天生会，AI 完全不会。

一、先讲清：这是什么测试？（ARC-AGI-3）

不是考试，是 “盲玩游戏”：150 多个全新小游戏，没规则、没教程、没目标、没提示。

人类：随便来个普通人，玩几分钟就摸清规律，100% 通关。

AI（GPT-5、Gemini 3.1 等）：最强的才 0.37%，基本等于 “完全玩不明白”。

二、AI 为啥这么拉胯？（3 个根本原因）

...

点击查看剩余70%

我知道答案，我要回答

我有问题

最新提问