杨立昆 :只会“文字接龙”的AI没有未来
2026-05-31 16:25:23 · chineseheadlinenews.com · 来源: 土豆包观察局
杨立昆离开 Meta 押注世界模型,正在把 AI 竞争从参数规模战拉回真实世界。

图1:杨立昆肖像与世界模型转向
在全球 AI 行业疯狂堆叠参数、算力和数据的当下,图灵奖得主、深度学习三巨头之一杨立昆(Yann LeCun)给出了一个极具争议的判断:仅靠自回归大语言模型,很难走向真正可靠的高级机器智能。
他的批评并不是否定大模型的工具价值。恰恰相反,LLM 已经证明自己能写作、编程、检索、总结、对话。但在杨立昆看来,它们更像强大的语言接口,而不是能理解现实、预测因果、规划行动的智能体。
换句话说,今天最火的大模型,可能只是 AI 发展史上的过渡形态。真正的下一站,不是更大的文字接龙机器,而是能够在真实世界中学习、预测和行动的世界模型。
▌一、从 CNN 到图灵奖:他为什么有资格质疑大模型
杨立昆出生于法国,是卷积神经网络的重要奠基者之一,并与 Geoffrey Hinton、Yoshua Bengio 共同获得 2018 年 ACM A.M. 图灵奖。
在深度学习从学术边缘走向产业中心的过程中,他既是参与者,也是少数不断提醒行业“别把当前路线神化”的人。
▌二、他为什么敢说:纯 LLM 有天花板
杨立昆对大语言模型的质疑,核心不在“它会不会写得像人”,而在“它是否真的理解世界”。当前主流 LLM 的基本训练目标,是根据上下文预测下一个 token。这个机制非常适合语言生成,却不天然等同于理解、计划和因果推理。

图2:自回归大模型的核心限制示意
因此,很多看似离散的问题其实有同一个根:模型可以输出正确的物理公式,却未必真正理解杯子为什么会摔碎;可以写出漂亮的长文,却可能在复杂推理中前后矛盾;可以模拟专业口吻,却可能在关键事实上一本正经地出错。
▌三、四个硬伤:不是参数不够,而是学习方式不够
第一,是逐 token 生成带来的局部性。模型一步步续写,容易缺少全局目标和稳定规划。长文本、复杂代码、多步骤任务中出现前后矛盾,并不只是“提示词没写好”,也反映出架构本身的限制。
第二,是常识的来源问题。人和动物通过视觉、触觉、行动和反馈获得世界经验,而大模型主要从文字中学习。文字是人类经验的压缩结果,带宽低、抽象高,天然丢失大量真实世界细节。

图3:真实常识来自感知、行动与反馈
第三,是幻觉难以彻底根除。只要目标仍是生成最像样的文本,模型就可能在没有可靠依据时继续补全。对闲聊来说这也许只是尴尬,对医疗、工业、法律等高风险场景来说却可能变成真正的问题。
第四,是离散符号和连续世界之间的错位。现实世界是连续、动态、带有物理约束的系统;token 则是离散符号。用文字统计去逼近现实规律,能覆盖很多表达问题,却很难独自承担真实世界决策。
▌四、世界模型:他押注的不是更大模型,而是另一种智能
杨立昆提出的方向,是让 AI 建立一种内部“世界模型”:它能够感知环境、理解状态、预测后果,并根据目标规划行动。这样的系统不只是回答问题,而是能在某种程度上模拟“如果我这么做,会发生什么”。

图4:世界模型需要形成感知、预测、规划、反馈闭环
这也是他反复强调动物智能的原因。猫狗不会背诵百科,但它们能避开障碍、理解遮挡、预判动作、在物理世界中生存。对杨立昆来说,这些能力才是机器走向更高级智能时必须补上的底层课。
▌五、JEPA:为什么他不迷信生成式路线
为了落地世界模型,杨立昆提出了 JEPA(Joint Embedding Predictive Architecture,联合嵌入预测架构)。它的关键思路不是把缺失内容逐字逐像素生成出来,而是在更高层的抽象表征空间里预测变化。

图5:JEPA 聚焦抽象表征预测,而不是逐像素复刻
这听起来有点抽象,但直觉很简单:人看见一个球滚向桌边,不需要在脑中渲染每一帧像素,也能判断它可能掉下去。JEPA 想学的,正是这种抓住核心变化、忽略无关细节的能力。
▌六、不是 AGI 神话,而是 AMI 路线
杨立昆更愿意谈 AMI,也就是高级机器智能,而不是被资本市场反复包装的 AGI 神话。他的观点是:人类智能并不是无所不能的“通用智能”,而是长期进化出来、适配现实环境的复杂能力集合。
所以,与其幻想一个突然无所不知的超级智能,不如先构建能理解物理世界、掌握常识、进行规划、在真实环境中可靠工作的机器智能。这条路更慢,却也更接近智能本身。
▌七、开源与垄断:他真正担心的风险
在 AI 风险问题上,杨立昆也常常与主流恐慌叙事保持距离。他并不认同“AI 很快自我觉醒毁灭人类”的简单末日论。相比之下,他更警惕少数巨头垄断基础模型和算力资源,进而控制 AI 生态的入口。
这也解释了他长期支持开放研究、开放模型和社区协作的立场。开放并不等于没有风险,但它能让更多研究者参与验证、复现和修正,也能避免最关键的技术只被少数公司握在手里。

图6:AI 的另一场竞争,是开放生态与闭源垄断之争
▌结语:真正的分歧,是 AI 要不要回到真实世界
杨立昆的尖锐之处,不在于他否定大模型,而在于他拒绝把大模型当成智能的终点。LLM 仍然会是重要工具,也会继续改变内容、办公、搜索、编程和交互方式。但如果 AI 要进入机器人、工业控制、医疗辅助、自动驾驶等高风险场景,仅仅会说话远远不够。
真正的智能,必须理解世界。它要知道物体不会因为被遮挡就消失,要知道行动会带来后果,要能在目标、环境和反馈之间不断校正自己。
所以,杨立昆的判断并不是“AI 没有未来”,而是:只靠今天这种文字接龙式 AI,没有未来。下一轮竞争,属于那些能把机器带回真实世界的人。