搜索

回答

现在的 AI 都是 “超级做题家”，但 ARC-AGI-3 考的是 “荒野求生”。人类天生会，AI 完全不会。

一、先讲清：这是什么测试？（ARC-AGI-3）

不是考试，是 “盲玩游戏”：150 多个全新小游戏，没规则、没教程、没目标、没提示。

人类：随便来个普通人，玩几分钟就摸清规律，100% 通关。

AI（GPT-5、Gemini 3.1 等）：最强的才 0.37%，基本等于 “完全玩不明白”。

二、AI 为啥这么拉胯？（3 个根本原因）

1. AI 是 “死记硬背”，人类是 “从零摸索”

AI：只会套训练过的模板、统计规律。遇到完全没见过、没文字说明的环境，直接懵圈。

人类：天生会好奇、试探、观察、总结规律—— 就像婴儿玩新玩具，不用教就会。

2. AI 没有 “自我反思”，错了也不知道改

人类：试错→发现不对→推翻思路→换方法→再试，天生会纠错。

AI：一条路走到黑，不会怀疑自己错了，只会无限重复无效操作。

3. 评分规则：AI 最擅长的 “蛮力试错” 被直接判死刑

得分公式：(人类步数 ÷ AI 步数)²

人类 10 步搞定，AI 走 100 步：得分不是 10%，而是 (10/100)² = 1%

AI 走 500 步：得分只剩 0.04%

AI 靠算力硬试，分数直接跌到接近 0

三、一句话总结差距

现在的大模型：数据喂大、指令驱动、模仿超强、只会做题。

AGI 需要：自主探索、抽象建模、自我纠错、随机应变 —— 这些人类天生有，AI 结构上就没有。

所以：AI 再强，也只是 “专用智能”；离真正的 AGI，还差着人类和动物那种本质差距。

网友回复

我知道答案，我要回答

我有问题