杨立昆：只会“文字接龙”的AI没有未来-墙外头条

杨立昆离开 Meta 押注世界模型，正在把 AI 竞争从参数规模战拉回真实世界。

图1：杨立昆肖像与世界模型转向

在全球 AI 行业疯狂堆叠参数、算力和数据的当下，图灵奖得主、深度学习三巨头之一杨立昆（Yann LeCun）给出了一个极具争议的判断：仅靠自回归大语言模型，很难走向真正可靠的高级机器智能。

他的批评并不是否定大模型的工具价值。恰恰相反，LLM 已经证明自己能写作、编程、检索、总结、对话。但在杨立昆看来，它们更像强大的语言接口，而不是能理解现实、预测因果、规划行动的智能体。

换句话说，今天最火的大模型，可能只是 AI 发展史上的过渡形态。真正的下一站，不是更大的文字接龙机器，而是能够在真实世界中学习、预测和行动的世界模型。

▌一、从 CNN 到图灵奖：他为什么有资格质疑大模型

杨立昆出生于法国，是卷积神经网络的重要奠基者之一，并与 Geoffrey Hinton、Yoshua Bengio 共同获得 2018 年 ACM A.M. 图灵奖。

在深度学习从学术边缘走向产业中心的过程中，他既是参与者，也是少数不断提醒行业“别把当前路线神化”的人。

▌二、他为什么敢说：纯 LLM 有天花板

杨立昆对大语言模型的质疑，核心不在“它会不会写得像人”，而在“它是否真的理解世界”。当前主流 LLM 的基本训练目标，是根据上下文预测下一个 token。这个机制非常适合语言生成，却不天然等同于理解、计划和因果推理。

图2：自回归大模型的核心限制示意

因此，很多看似离散的问题其实有同一个根：模型可以输出正确的物理公式，却未必真正理解杯子为什么会摔碎；可以写出漂亮的长文，却可能在复杂推理中前后矛盾；可以模拟专业口吻，却可能在关键事实上一本正经地出错。

▌三、四个硬伤：不是参数不够，而是学习方式不够

第一，是逐 token 生成带来的局部性。模型一步步续写，容易缺少全局目标和稳定规划。长文本、复杂代码、多步骤任务中出现前后矛盾，并不只是“提示词没写好”，也反映出架构本身的限制。

第二，是常识的来源问题。人和动物通过视觉、触觉、行动和反馈获得世界经验，而大模型主要从文字中学习。文字是人类经验的压缩结果，带宽低、抽象高，天然丢失大量真实世界细节。

图3：真实常识来自感知、行动与反馈

第三，是幻觉难以彻底根除。只要目标仍是生成最像样的文本，模型就可能在没有可靠依据时继续补全。对闲聊来说这也许只是尴尬，对医疗、工业、法律等高风险场景来说却可能变成真正的问题。

第四，是离散符号和连续世界之间的错位。现实世界是连续、动态、带有物理约束的系统；token 则是离散符号。用文字统计去逼近现实规律，能覆盖很多表达问题，却很难独自承担真实世界决策。

▌四、世界模型：他押注的不是更大模型，而是另一种智能

杨立昆提出的方向，是让 AI 建立一种内部“世界模型”：它能够感知环境、理解状态、预测后果，并根据目标规划行动。这样的系统不只是回答问题，而是能在某种程度上模拟“如果我这么做，会发生什么”。

图4：世界模型需要形成感知、预测、规划、反馈闭环

这也是他反复强调动物智能的原因。猫狗不会背诵百科，但它们能避开障碍、理解遮挡、预判动作、在物理世界中生存。对杨立昆来说，这些能力才是机器走向更高级智能时必须补上的底层课。

▌五、JEPA：为什么他不迷信生成式路线

为了落地世界模型，杨立昆提出了 JEPA（Joint Embedding Predictive Architecture，联合嵌入预测架构）。它的关键思路不是把缺失内容逐字逐像素生成出来，而是在更高层的抽象表征空间里预测变化。

图5：JEPA 聚焦抽象表征预测，而不是逐像素复刻

这听起来有点抽象，但直觉很简单：人看见一个球滚向桌边，不需要在脑中渲染每一帧像素，也能判断它可能掉下去。JEPA 想学的，正是这种抓住核心变化、忽略无关细节的能力。

▌六、不是 AGI 神话，而是 AMI 路线

杨立昆更愿意谈 AMI，也就是高级机器智能，而不是被资本市场反复包装的 AGI 神话。他的观点是：人类智能并不是无所不能的“通用智能”，而是长期进化出来、适配现实环境的复杂能力集合。

所以，与其幻想一个突然无所不知的超级智能，不如先构建能理解物理世界、掌握常识、进行规划、在真实环境中可靠工作的机器智能。这条路更慢，却也更接近智能本身。

▌七、开源与垄断：他真正担心的风险

在 AI 风险问题上，杨立昆也常常与主流恐慌叙事保持距离。他并不认同“AI 很快自我觉醒毁灭人类”的简单末日论。相比之下，他更警惕少数巨头垄断基础模型和算力资源，进而控制 AI 生态的入口。

这也解释了他长期支持开放研究、开放模型和社区协作的立场。开放并不等于没有风险，但它能让更多研究者参与验证、复现和修正，也能避免最关键的技术只被少数公司握在手里。

图6：AI 的另一场竞争，是开放生态与闭源垄断之争

▌结语：真正的分歧，是 AI 要不要回到真实世界

杨立昆的尖锐之处，不在于他否定大模型，而在于他拒绝把大模型当成智能的终点。LLM 仍然会是重要工具，也会继续改变内容、办公、搜索、编程和交互方式。但如果 AI 要进入机器人、工业控制、医疗辅助、自动驾驶等高风险场景，仅仅会说话远远不够。

真正的智能，必须理解世界。它要知道物体不会因为被遮挡就消失，要知道行动会带来后果，要能在目标、环境和反馈之间不断校正自己。

所以，杨立昆的判断并不是“AI 没有未来”，而是：只靠今天这种文字接龙式 AI，没有未来。下一轮竞争，属于那些能把机器带回真实世界的人。