超越π*0.6:具身智能奇点已至

2026-02-14 02:25:29 · chineseheadlinenews.com · 来源: 新智元

极佳视界具身大模型 GigaBrain-0.5M*,以世界模型预测未来状态驱动机器人决策,并实现了持续自我进化,超越 π*0.6 实现 SOTA!懊模型在叠衣、冲咖啡、折纸盒等真实任务中实现接近 100% 成功率;相比主流基线方法任务成功率提升近 30%;基于超万小时数据训练,其中六成由自研世界模型高保真合成。

具身世界模型新一代原生范式重磅登场!

继具身基础模型 GigaBrain-0.1 斩获 RoboChallenge 全球第一后,性能更强大的 GigaBrain-0.5M* 又来了。

作为依托世界模型实现自我进化的 VLA 大模型,GigaBrain-0.5M* 在家庭叠衣、服务冲煮咖啡、工业折纸盒等多个真实机器人任务中,均实现零失误、可持续稳定运转。

igaBrain-0.5M* 作为一款基于世界模型条件驱动(World Model-Conditioned)的 VLA 大模型,以世界模型对未来状态与价值的预测结果作为条件输入,可显著提升模型在长时程任务中的鲁棒性。

在此基础上,GigaBrain-0.5M* 创新引入人在回路(Human-in-the-Loop)持续学习机制,系统依托经人工筛选与校正的模型推演轨迹开展迭代训练,基于真实环境交互反馈持续优化决策策略,最终实现“行动 — 反思 — 进化”的闭环式持续学习与自主迭代升级。

论文链接:https://arxiv.org/pdf/2602.12099

项目链接:https://gigabrain05m.github.io/

基于世界模型的强化学习的训练范式

在 GigaBrain-0.5M* 的研发中,极佳视界提出基于世界模型的强化学习范式,并采用迭代式四阶段闭环训练流程:

基于大规模机器人操作数据完成世界模型预训练,实现对未来状态及对应价值的精准预测;

以世界模型输出的未来状态预测与价值评估为条件,对策略网络进行微调,以指引动作决策;

将条件化策略部署至真实物理环境,依托人在环干预机制,采集模型自主推演轨迹数据;

利用经筛选后的有效轨迹数据集,联合优化世界模型与决策策略,实现模型持续学习与自主进化。

连续零失误执行

在与 AWR、RECAP 等主流模仿学习与强化学习基线方法的系统对比中,GigaBrain-0.5M* 展现出显著优势,在相同任务设定下,相较于由 π*0.6 所提出的 RECAP 基线,任务成功率提升近 30%,并实现了稳定可靠的模型效果。

尤其在高难度长时程任务中,面对折纸盒、咖啡制备、衣物折叠等包含多阶段操作、精细感知与持续决策的复杂场景,GigaBrain?0.5M* 均实现接近 100% 的任务成功率,并可稳定复现成功执行轨迹,充分彰显出卓越的策略鲁棒性。

高效且准确的价值预测

实验结果表明,基于世界模型的价值预测方案在执行效率与预测精度上,均优于 π*0.6 提出的 VLM 方案。

该方案的核心优势源自对未来状态的显式建模与世界模型单步降噪机制,可为价值函数提供关键的时序上下文支撑,让价值估计实现更高效、更精准、更稳定的输出。

以叠衣服任务为例:

任务初期,机械臂反复调整衣物姿态时,预测价值呈现合理波动;

当衣物摆正、进入稳定叠放阶段,价值曲线稳步上升;

若中途出现干扰物,价值骤降以反映任务受阻;

待干扰物被移除后,价值迅速恢复增长趋势。

这种与任务物理进程高度对齐的价值演化,正是世界模型提供“认知先验”的直接体现。

上万小时的训练数据

GigaBrain-0.5M* 的基座模型 GigaBrain-0.5 基于总计 10931 小时的多样化机器人操作数据进行预训练,其中 61%(6653 小时)由自研具身世界模型 GigaWorld 高保真合成,覆盖纹理迁移、视角变换、人手到机械臂映射等丰富场景;

剩余 39%(4278 小时)源自真实机器人采集,确保策略在物理世界中的可执行性。

海量数据的引入显著拓展了模型的任务覆盖广度与策略鲁棒性,使其在面对复杂、长时程操作任务时具备更强的泛化能力;

而 GigaWorld 生成的合成数据则有效突破了真实采集的长尾瓶颈。

通过可控地生成新纹理、新物体位姿与新观测视角下的训练样本,增强了模型在分布外场景中的适应性,为具身智能走向开放世界奠定了数据基石。

关于极佳视界

极佳视界是一家具身智能和通用机器人公司,围绕“基模 — 本体 — 场景”三位一体,为工业、商业、家庭等场景提供软硬一体的具身智能机器人解决方案,推动通用机器人服务千行百业、走进千家万户。

公司核心团队包括清华、北大、中科院、中科大、WashU、CMU 等全球知名院校顶尖研究人员,以及来自微软、三星、地平线、百度、博世等全球知名企业高管,核心团队在物理 AI 方向兼具业内领先的研究能力和大规模的产业落地经验。

极佳视界是国内第一家布局世界模型的科技公司,以世界模型平台 GigaWorld、通用具身大脑 GigaBrain、原生本体 Maker 构建闭环生态,致力实现 10-100 倍以上的数据、训练、测试全链路效率提升,推动通用具身智能机器人、通用自动驾驶等物理 AGI 大规模爆发。


    24小时新闻排行榜更多>>
  1. 冬奥自由滑 马里宁成功后空翻 但痛失奖牌
  2. 美西民主党人集会 抗议中共抓捕调查记者刘虎
  3. 马斯克关闭星链重创俄军通讯 专家警示私企左右战局
  4. 2026大龄剩女天塌了!50女抢1男
  5. 中共政府对美籍奥运明星的暗中资助惊人
  6. 两天内三重打压港人 香港议会议长:唯一出路推倒中共
  7. 新造的F-35没雷达?
  8. 四名土耳其女网红被通缉,“发布了不堪入目的内容”
  9. 祸起清零政策 青海男遭警群殴案再引关注
  10. 前世汉族女子 转生侗族的奇人
  11. 日最大在野党新党魁表态
  12. 为何美国这家快餐厅要移除所有微波炉
  13. 日最大在野党新党魁上路 “不排斥自卫队入宪”
  14. DeepSeek春节再扔王炸
  15. 泰总理结婚,夫人来自华裔家庭
  16. 陆媒:海外华人回国过春节 把海外找不到的统统带走
  17. 美驻华领事领奏《大东北我的家乡》 全网赞爆
  18. 慕尼黑安全会议期间 卢比奥和王毅会面
  19. 黄仁勋跌出全球十大富翁
  20. 李在明遇刺案幕后人曝光,幕后藏镜人居然是他!
  21. 人类能把地下生活过成什么样?
  22. 川普宣布《海洋行动计划》 重振造船业
  23. 74岁宋春丽近况曝光
  24. 美最新中共军企名单为何短暂发布 原因揭晓
  25. 点2千多次外卖顾客消失,老板喊话“报平安”
  26. 纽约DMV今起全关,别白跑一趟
  27. 卢比奥与王毅会晤
  28. 潜逃16年逃犯赴冬奥看球被抓
  29. 英国客机飞一半惊遭战机包围 竟是小孩“乱改热点名”
  30. 500万阿富汗难民返国 联国警告:援助体系濒临崩溃
  31. 白宫将召开“和平委员会”会议 准备设立援助资金
  32. 普京强行收编国家近卫军,强化统治
  33. 日本支援乌克兰越冬物资
  34. 凭37年前一枚模糊指纹,香港前TVB女主播破获悬案
  35. 安德鲁借巨款付性侵封口费至今未还 债主包括女王
  36. "基于规则的秩序已不存在 美国领导地位已丧失"
  37. 官媒:春节前夕 习近平等中央领导看望胡锦涛等人
  38. 迟到的“黑名单”
  39. 西方5国百姓担忧“三战即将爆发” 军费增加意愿曝光
  40. 为何高盛认为市场误读了微软的资本开支?
  41. 与美国潜在经济协议内容疑曝光 俄拟重返美元结算
  42. 乌克兰外长称与中国外长讨论了“和平努力”
  43. 华为原技术部高管涉受贿罪被捕
  44. 向伊朗施压 美国派遣第二艘航母前往中东
  45. 加价近100%也约不上!节前这个行业彻底“爆单”了
  46. 收手吧周星驰
  47. 王小洪“中弹了?” 张又侠、刘振立翻盘依然有望
  48. 中南海再掀惊涛 传王小洪“患病”背后
  49. 国土安全部拨款参议院受阻 但实际影响有限
  50. SpaceX火箭发射 将4宇航员送往国际空间站
  51. 惊爆高金素梅见胡锦涛后 国台办转交近亿元?张俊杰负责发钱
  52. 生物学博士橙县演讲:进化论如何渗透社会
  53. AI主导诊疗 vs AI成为得力助手
  54. 世界最南端的城市:乌斯怀亚
  55. 美国1月CPI同比2.4%,低于预期
  56. 日本水产厅释放遭逮捕的中国船长
  57. 震撼!CIA居然发布新视频招募中国军方线人
  58. 租屋族饮水过滤设备怎么选?
  59. 消息:美军正为可能持续数周伊朗行动做准备
  60. 从地方选举到社群渗透:孙耀宁案的七大关键