“世界模型”竞赛升级:Runway推出GWM-1

2025-12-13 03:25:18 · chineseheadlinenews.com · 来源: 华尔街日报

Runway试图从影视行业的“特效供应商”,进化成物理世界的“AI架构师”。GWM-1目前有GWM-Worlds、GWM-Robotics和GWM-Avatars三个模型变体,其中Worlds支持基于物理规律的实时环境交互与Agent导航训练,Robotics致力于生成极端变量下的合成数据以进行机器人策略评估,Avatars则通过音画统一架构,实现了无画质损耗的长时拟人对话。

AI视频的战场,正从单纯的比拼画质,进化到比拼对物理世界的理解。

12月11日,AI视频生成独角兽Runway正式发布了其首款通用世界模型(General World Model)——GWM-1,正式杀入由谷歌、英伟达等巨头领先的“世界模拟”战场。

与传统的AI视频生成模型不同,GWM-1被设计为一个能够理解物理规律、几何结构及环境动态的模拟系统,其核心突破在于“连贯性”与“交互性”。

Runway宣称,基于对物理规律和环境动态的理解,该模型能通过逐帧预测来模拟世界随时间演变的过程,并支持长达数分钟的连贯实时交互。

拆解GWM-1:从“像素预测”到“通用模拟”

所谓“世界模型”,是指在让AI在内部构建对现实世界运行机制的模拟,使其能够在无需遍历现实所有场景的情况下,具备推理、规划和行动的能力。

“要构建一个世界模型,首先需要构建一个真正卓越的视频模型。”Runway首席技术官Anastasis Germanidis在发布会上指出,教模型直接预测像素,是实现通用模拟的最佳路径。

不过,尽管被冠以“通用”之名,但目前的GWM-1实际上是由三个针对不同领域进行后训练的自回归模型(GWM-Worlds、GWM-Robotics和GWM-Avatars)组成的模型系列,且均建立在Runway最新的Gen-4.5基座模型之上。

Runway明确表示,其最终愿景是将这些不同的领域和动作空间统一到一个单一的基础世界模型中。

(1)GWM-Worlds:可交互的数字环境探索界面

先看GWM-Worlds。

如前所述,GWM-Worlds是建立在Runway最新的Gen-4.5基座模型之上,进行后训练的自回归模型。这意味着,它采用了逐帧预测的方式预测下一帧。

换而言之,在任何时刻,用户都可以根据应用场景进行干预,例如在空间中移动、控制机械臂或与智能体交互,模型都会模拟接下来发生的事情。

在官方的演示素材中能看到,该模型提供了一个用于探索数字环境的界面,用户可以通过提示词或参考图像设定场景,模型将以24fps的帧率和720p的分辨率生成环境。

与传统视频生成不同,用户可以实时改变镜头视角、环境条件或物体状态,模型能够理解几何与光影,确保生成的画面在长序列运动中保持连贯性。

除了游戏设计预览和VR环境生成外,GWM-Worlds更深远的意义可能在于为AI Agent提供训练场,教导它们如何在物理世界中导航和行动。

(2)GWM-Robotics:解决具身智能的“数据饥渴”

如果说GWM-Worlds还带有创意工具的基因,那么GWM-Robotics的推出,则展示了Runway进军工业与具身智能领域的野心。

在机器人研发中,获取极端天气、突发障碍等“长尾场景”的真实数据成本极高。GWM-Robotics旨在解决这一痛点,通过生成高质量的“合成数据”,模拟各种环境变数,帮助机器人在虚拟空间中进行策略评估。这不仅能大幅降低训练成本,还能在机器人投入真实世界前预判其违规风险。

Runway已明确表示,目前正通过SDK向部分企业开放GWM-Robotics,并与多家机器人公司保持积极接触。显然,Runway试图在单纯的SaaS订阅收入之外,开辟面向B端工业客户的新业务。

(3) GWM-Avatars:统一视频与语音的交互终端

GWM-Avatars则瞄准了人机交互。这是一个将视频生成与语音结合的统一模型,Runway宣称其生成的数字人能进行长时间连续对话且无画质损耗。

若该技术效果属实且能规模化落地,或将对客户服务及在线教育行业产生颠覆性影响。

基座进化与算力军备

在仰望“世界模型”的同时,Runway并未放松对现金牛业务的巩固,也对当家的视频生成基座进行了防御性升级,以应对来自Kling(可灵)等竞争对手的追赶。

同期发布的Gen-4.5模型更新,补齐了原生音频和多镜头编辑的短板。新版本支持生成长达一分钟的视频,并能保持角色一致性、生成原生对话和背景音效,继续从“C端玩具”迈向“B端生产力工具”的征程。

值得一提的是,为了支撑公司从创意生成迈向世界模拟的庞大算力需求,Runway还宣布与云服务商CoreWeave达成协议。据Runway披露,未来将利用CoreWeave云基础设施上的Nvidia GB300 NVL72机架进行模型训练与推理。

结语

从影视创意工具到机器人模拟器,Runway的战略版图正在极速扩张。但在世界模型这一新赛道上,它已不再拥有视频生成初期的先发优势。

面对Google、Nvidia等拥有深厚底层资源和科研积累的巨头,能否利用GWM-1证明自己不仅是一家影视行业的“特效供应商”,而是有能力成为物理世界的“AI架构师”,将是评估其估值能否迈向下一阶段的关键。


    24小时新闻排行榜更多>>
  1. 无锡一骨科医院住院大楼深夜失火
  2. 习近平:实践证明,对我们“卡脖子”是卡不住的
  3. 从中国出发 未抵达伊朗:美军一次高调的海上拦截
  4. 人的一生只能吃9吨食物?
  5. 组图:摄影师捕捉到银河系的壮丽瞬间
  6. 若AI无法兑现生产力承诺,美将面临债务危机
  7. 李传良的逃亡与监控人生:逃到美国荒漠 也逃不掉…
  8. 川普想在美国卖日本"国民神车",因为"很可爱"
  9. 黄金白银期货将迎巨大抛压
  10. 世界最宜居十大城市,BC省崭露头角
  11. 张维为:统一后5-10年 台北达到大陆二线城市水准
  12. 何晴廖京生恋情真相揭秘
  13. 一个“荒野求生”火了,千万个“谎野求生”都出来了
  14. 川普说漏嘴,俄罗斯挖出CIA间谍?
  15. 涉国安法三罪名成立 黎智英法庭上神情平静
  16. 智利强硬保守派卡斯特当选新总统
  17. 悉尼枪击案16死40伤,两嫌犯是父子
  18. 河南村镇银行三名受害人维权 遭强制驱离
  19. 消费、投资和房市 中国经济在多方面恶化
  20. 中国权贵将天量资产转到美国 这法案一通过就公开
  21. 邓聿文:马兴瑞被“晾”五个月,显然很不正常
  22. 传下月开“五中全会” 胡春华与张升民入政治局、马兴瑞被官宣
  23. 《求是》杂志发表习近平重要文章
  24. 冒死拍摄新疆集中营 中国青年在美临遣返引关注
  25. 知名海滩11死29伤,2名枪手扫射人群
  26. “六神磊磊读金庸”也违规了!被禁止关注
  27. 历史47次验证 2026与2027赤马红羊年必有翻天巨变
  28. 《怦然心动》导演与妻子家中遇害,还未证实是其子所杀
  29. 传日本暂停对绝大多数中国人发放签证 系统维护背后的现实考量
  30. 川普掀桌 欧洲三宗罪 德美必有特殊一战?默克尔被逼出山
  31. 顾国平曝光遭警方下药强行拘留细节
  32. 投资低迷加剧,中国经济进入更保守时代
  33. 中共收紧监管 讲座发言人政治背景纳入审查
  34. 美边境沙皇:非法移民医疗支出达数十亿美元
  35. 丁长求的心梗而亡大清洗真相 习近平并列马列为何没有斯大林
  36. 叙利亚逮捕五名袭击美军的嫌疑人
  37. BBC:如何才能令普京停止在乌克兰的战争?
  38. 川普想在美国卖日本“国民神车”
  39. 导演罗伯雷纳家中2死 警方研判疑似他杀
  40. 刚果(金)南基伍省战火持续
  41. 为什么你会比闹钟响的时间早几分钟醒来?
  42. 赌场牌照核发,居民冒雪再抗议
  43. 简志诚任新会长 台美商会修章程培育领袖
  44. 一种激素的“两刃性”
  45. 习近平的五个迷思 川普想打的是“美国的内战”
  46. 大陆社媒审核加严 误删暴增 公安账号也中招
  47. 海湾大桥收费亭将被拆除,启用电子收费
  48. 太阳马戏团ECHO进驻甲骨文球场
  49. 在中国市场遇冷 玛莎拉蒂纯电车爆跌至35万元
  50. 乌克兰和平计划柏林会谈取得重大进展
  51. 2026年要报税吗?美国人需知这些信息
  52. 德州多地发布冻害预警
  53. 11月70城房价:房价环比总体下降
  54. 美国土安全部:半年来洛杉矶抓上万非法移民
  55. 别再买胶原蛋白了?煮饭时加一小把“黄金搭档”
  56. 罕见示弱!川普预警:共和党恐失众院控制权
  57. 约克区长期无家可归者增幅达109%
  58. 这国突然转向,打破中国“垄断地位”
  59. 海滩恐袭中的夺枪侠竟是穆斯林!一个果蔬店老板
  60. “鸟叔”麻烦大了!半个韩娱现原形 塌房的总是同一批人