哈萨比斯:DeepMind才是Scaling Law发现者
2025-12-08 05:25:40 · chineseheadlinenews.com · 来源: 量子位
Scaling Laws不死!
前有llya暴论Scaling遇到瓶颈,后脚哈萨比斯就隔空力挺Scaling Law:
Scaling有用,而且AGI必须用。

u1s1,哈萨比斯说这话,有理有据。
且看今年硅谷哪家赢得盆满钵满,毫无疑问非谷歌莫属。
刚刚靠Scaling Law打了场漂亮的翻身仗,谷歌Gemini 3全网爆火就是最好的验证。

除此之外,在这场Axios AI+峰会上,他还透露了有关Scaling Law的更多细节,以及对未来12个月AI的发展预测:
Scaling Law最早的发现者不是OpenAI,是DeepMind。
单靠Scaling Law,也有可能达成AGI。
明年世界模型依旧重中之重。
Gemini的未来是通用万能助手。
结果显而易见,他的这番“逆风”发言在?上引发了两极分化的讨论。
有人支持他对Scaling Law许下的美好愿景:Scaling还能再撑五百年(doge)

也有人认为Scaling Law不是长远之计……

不过说归说,哈萨比斯这场访谈还是有很多可取之处,下面123开学走起:
Scaling在实现AGI上的关键作用
有趣的是,往前追溯Scaling Law的历史,公认开山立派的是2020年的OpenAI,转折则出自2022年的谷歌DeepMind。
哈萨比斯这次却给出了另一个视角,或许能解释为什么谷歌DeepMind始终坚持Scaling Law路线。
事实上,Scaling Law最早是由我们的团队发现的。
不过那时,Scaling Law还不叫这个名字,它在内部被称为“Chinchilla Scaling Laws”。

该发现源自于DeepMind在2017年至2018年期间对大语言模型的研究,不过那时它们并没有被公开发布,而是作为内部资料进行使用。
Scaling Law的有效性引起了DeepMind的注意,于是他们开始调整研究方向,将更多的资源投入其中。
而这一决策也促使DeepMind在大模型领域取得了空前的成功,从Gemini的1.0到如今的3.0时代,可以说谷歌用工程化极致诠释了什么是Scaling Law。
所以对于AGI的终极幻想,谷歌DeepMind仍然坚定认为,Scaling Law必不可少。

首先无论最终的AGI呈现出何种形态,Scaling都会是其中的关键组成部分。
就当下而言,Scaling并没有完全到达极限,继续沿着该路线将系统推向最大化,是必要的过程。
甚至夸张一点讲,Scaling甚至可以是整个AGI系统。
AGI作为一种仍处于理论阶段的AI版本,要展现出类人的智慧能力,Scaling Law的大量数据和计算资源的投入,无疑是一种合理的解决途径。
不过哈萨比斯也猜测,除了Scaling Law,AGI还需要一两个类似Transformer或AlphaGo级别的的重大突破。

而这个时间也不会太久,哈萨比斯说:
Maybe 5到10年。
展望未来12个月后的AI
至于12个月后,人工智能会发展到何等程度,哈萨比斯强调了以下几个观点:
1、完整的多模态融合。
这是目前谷歌DeepMind正在全力推进的方向。
从基础模型Gemini开始,就主打多模态定位,可以无缝处理图像、视频、文本和音频,并生成相应类型的输出。
这类交叉融合将在接下来一年里,继续成为主流AI模型的演进方向,以全面提升模型的推理和创造力。
2、视觉智能的突破。
以谷歌最新的Nano Banana Pro举例,这类图像模型展示了对视觉的惊人理解,可以创建出高度精准的信息图表。
所以在这一点上,还有值得继续探索的空间,比如解锁更丰富的分析、故事讲述和分步视觉推理。

3、世界模型的普及。
今年以来,大牛们纷纷开始押注世界模型。
从李飞飞公测世界模型Marble、LeCun离职创业世界模型……哈萨比斯也在采访中表示,世界模型也是他个人目前的工作重点之一。
8月份谷歌上线的世界模型Genie 3,可以让用户生成一段交互式视频,然后像在游戏里一样在视频中自由走动,并保持长达一分钟的连贯性。
所以下一年,世界模型依旧会饱受业界关注。
4、Agent变得可靠。
坦白来说,现有的Agent系统还并不完全可靠,无法将任务完全交付它们。
但哈萨比斯认为,再有一年时间,Agent将改变这个局面,开始接近于可靠地完成委托任务。
至于Gemini,他们对其设定的最终目标是——成为通用助手。

现在的Gemini 3,独到之处在于其个性化的深度。
回答简洁,且能够温和地反驳不合理的观点,能让用户切实感受到模型在智能和实用性上有了质的飞跃。
另外让哈萨比斯感到惊喜的是,Gemini 3可以用于一键式生成商业级游戏,而且只需要几个小时。
这展现出了Gemini 3在除Scaling Law之外,基座架构的优势:能够理解高层次指令并输出高精度细节。
所以下一代Gemini将会继续延续Gemini 3的优势,不仅会出现在更多设备上(如眼镜、手机等),还会无缝融入人们日常生活的一部分,也许是提高工作效率,也可以是改善个人生活品质。
总之,使用Gemini的频率,将变得和使用手机一样频繁。