一年磨一剑,今年最炸机器人Demo来了

2026-05-08 03:25:18 · chineseheadlinenews.com · 来源: 量子位

看过的人已经傻眼了,因为这可能是今年为止最炸的机器人demo。

刚刚,Genesis AI发布首个机器人基础模型GENE-26.5,让机器人能自主打鸡蛋,拧试管盖,弹钢琴,玩魔方,切番茄。

全程自主运行,1倍速,同一个模型。

亮相后,前1x副总裁Eric Jang,宋舒然教授等业内大佬纷纷转发评论,表示赞叹。

如果你对这个半路杀出的团队感到陌生,下面这个gif可能会让你想起些什么。

一年多以前,他们在GitHub上发布了那个炸穿互联网的Genesis物理引擎。

一句话生成物理世界,28.6k Star,学术圈半壁江山参与。

创始团队在2025年中拿了1.05亿美元种子轮出来创业,沉默了将近一年。

现在回来了。

今年为止最炸的机器人demo

GENE-26.5的demo大概是机器人领域今年到目前为止最值得认真看的,咱们来速通一下。

烹饪场景

四分钟,20个子任务串成完整流水线。单手打蛋,五指配合控制裂纹走向。

双手切番茄,一只手调整角度,另一只手下刀。毛巾、盐磨、打蛋器、刀、铲、煎锅轮番上阵。

搞笑的是,打完鸡蛋他还拿毛巾擦了一下手,怪干净的……

实验室移液操作

从抓移液器到装离心机,全流程毫米级精度。最难的是拧试管盖和手内换握姿势。

解魔方

双臂协作,连续空中翻转,实时闭环。

此前不靠专用夹具完成魔方的标杆还是2019年OpenAI那只单手,Genesis称这是通用双臂系统的首次。

△图源:OpenAI

做冰沙

语言指令驱动的长序列任务,固体、可变形物体、液体全涉及。

吸管翻转

测试极脆弱半透明物体的处理,最后一步手内翻转需要多根手指高度同步。

多物体抓取

单手同时抓四个不同尺寸物体,四种抓握方式并行,展示灵巧手相比传统夹爪的效率差距。

线束整理

汽车产业的“圣杯任务”。双手操控柔性线缆打捆、挂架、缠胶带,公认最难的工业操控任务之一。

弹钢琴

Rush-E,约130BPM,专门压测控制栈极限,策略用RL在仿真中单独训练。

以上大多数复杂技能,GENE只需要不到1小时的任务专属机器人数据,不到200个episode。

值得一提的是,Genesis CEO周衔在接受Business Insider采访时表示:

烹饪大多数步骤成功率在90%到95%,但单手打蛋和用刀转移切好的番茄只有50%到60%。整体操作速度大约是人类的六七成。

全栈怎么做的

Genesis博客里说了一句话把整个技术思路讲透了,操控不是一个纯模型训练问题,是一个系统问题。任何一层的短板都会传导到整个系统。

所以他们选择每一层都自己做。

硬件,一双和人手一样大的手

Genesis在demo中使用的灵巧手,20个可反向驱动的自由度,与人手1:1尺寸匹配,手掌和手指覆盖柔软材料模拟皮肤接触力学。

这种设计让人手动作可以直接映射到机械手上,不需要复杂的重定向算法。

值得一提的是,不少业内人士指出这双手与国内灵巧手公司舞肌科技(Wuji Tech)的产品高度相似。

Genesis官方博客将其称为Genesis Hand 1.0,但未详细说明硬件来源。

回到手的尺寸上,为什么要做到与人手1:1,是因为机器人领域存在一个叫“具身差距”的老问题,人手和机械手形态不一样,人类动作数据就没法直接迁移到机器人上。

Genesis的解法很粗暴,把手做成一模一样,差距就消失了。

控制栈也一并重写。Genesis把机械臂供应商的出厂控制器整个换掉,自研中间件跑在PREEMPT_RT实时内核上,EtherCAT通信500Hz,端到端延迟最低压到3毫秒。

原厂控制器画一个15厘米的圆追踪误差20毫米,换上Genesis的控制器后降到2毫米,提升一个数量级。单关节追踪延迟从80毫秒降到9毫秒。

这层的意义在于,当训练数据来自人类动作而不是机器人遥操作时,控制系统的延迟和误差会在训练信号和实际执行之间制造鸿沟。延迟越低,人类数据就越好用。

数据,让工人上班顺便采集

在数据采集方面,Genesis主要采用一双与灵巧手配套的数据采集手套。

机器人手和人手尺寸一致,手套记录的手指运动可以无损映射到机器人上,不需要复杂的重定向算法。硬件成本是传统方案的百分之一,采集效率是遥操作的五倍。

数据引擎总共有三层来源。

手套数据提供最高保真度的手部运动和触觉信号。第一人称视频捕捉自然行为和任务多样性。第三人称互联网视频提供海量覆盖。

三层数据在质量和规模上做了帕累托分布,Genesis和合作伙伴已经收集了超过20万小时的多模态数据。

Genesis总裁Gervet对TechCrunch说了一句有意思的话,这只手套可以让实验室技术员、制造业工人在干日常工作的时候顺便采集数据,不打断工作流。

当然TechCrunch也追问了一个尖锐的问题,工人会愿意戴着手套和摄像头来训练最终可能取代自己的机器人吗?

Gervet的回答是,这个得看客户和员工之间怎么谈,具体细节还没敲定。

模型,一个统一的轨迹联合分布

GENE-26.5的模型目标是学一个能同时吸收语言、视觉、本体感觉、触觉和动作的统一模型。用flow matching对轨迹建模联合分布,捕捉多模态的未来可能性。

几个关键设计。

第一,支持异构、部分可观测数据的可扩展训练,第一人称视频流、手套数据、机器人控制数据、互联网视频,不需要显式对齐就能一起训练。

第二,同一个模型处理所有任务,控制、状态估计、逆动力学、目标推断都变成对联合分布的条件查询,缺失的模态通过去噪推断。

第三,可以灵活吸收预训练模型的先验,VLM提供语义理解,世界模型提供时序和物理动态。

简单说就是一个模型吃所有模态的数据,做所有类型的任务。demo里展示的几个场景,除了钢琴演奏是单独用RL训练的之外,其余全部共享同一套权重。

训练和评估,仿真是加速器

Genesis团队在博客里放了三张scaling曲线,透露了训练recipe的关键信息。

预训练阶段,open-loop评估显示模型规模和计算量增加时验证损失持续下降,符合经典的scaling law。

但他们强调open-loop指标对机器人来说远远不够,关键是closed-loop表现,就是模型的动作会影响后续观测的闭环场景。

这里Genesis物理引擎的老本行就派上用场了。他们用最新版Genesis World仿真器做大规模闭环评估,不需要在仿真数据上做任何co-training,仿真环境的保真度已经足够直接评估真实世界训练的模型。

每个数据点对应200个评估设置和超过150小时的机器人执行时间,整张图如果在真实世界跑需要2700个人-机器人小时。结论是预训练数据量越大,zero-shot泛化能力越强。

到fine-tuning阶段回到真实世界。他们专门构造了预训练中完全没见过的新任务,在超低数据量条件下测试,每个任务只用20到30分钟的数据。

demo里展示的那些复杂技能,大多数只需要不到1小时的任务专属机器人数据,换算下来不到200个episode。预训练规模越大,fine-tuning也越快、数据需求越少、最终表现越好。

周衔对TechCrunch说,模型迭代速度的真正瓶颈是评估,仿真帮他们大幅加速了这个循环。

从物理引擎到通用机器人

2024年底,CMU博士周衔牵头开源了Genesis物理引擎。

这款纯Python仿真平台比英伟达Isaac Gym快10到80倍,GitHub上迅速成为最大的具身智能开源项目,吸引了20多个研究机构参与。

周衔本科毕业于新加坡南洋理工,是Genesis物理引擎的发起人。

2025年初,Genesis AI在法国注册成立,由周衔担任CEO,总裁是Théophile Gervet,同样来自CMU,曾在具身智能独角兽Skild AI任早期研究员,后加入Mistral AI做研究科学家。

两人师出同门,导师都是Katerina Fragkiadaki。

成立几个月后,团队拿到1.05亿美元种子轮,Eclipse和Khosla Ventures领投,谷歌前CEO Eric Schmidt、法国电信大亨Xavier Niel个人参投,法国国家投资银行Bpifrance也在投资方名单里。

作为参考,此前具身智能赛道最大的种子轮是Physical Intelligence的7000万美元。

拿到钱之后,团队没有急着发产品,而是花了将近一年时间闷头搭全栈。

今天,GENE-26.5。模型、硬件、控制栈、仿真器,一次性全部亮相。团队从创始时的几个人扩展到60人,巴黎、加州、伦敦三地办公,欧美大约四六开。已经收集了超过20万小时的多模态数据,正在与多个行业客户洽谈合作。

周衔告诉TechCrunch,接下来很快会公布第一个通用机器人,全身的,不只是手。


    24小时新闻排行榜更多>>
  1. 尘埃落定 两任国防部长魏凤和、李尚福被判死缓
  2. 重庆公安局长张安疆突死亡 传言四起
  3. 中共两任防长李尚福、魏凤和双双被判死缓
  4. 两美军士兵军演时失踪 内部报告:悬崖看日落坠海
  5. 胜利日当天莫斯科将断网 民众被建议下载离线地图
  6. 美国兄弟冒充中东皇室成员 中国投资者被骗1800万
  7. 两名中国前国防部长为何遭判死缓 杀鸡给猴看?
  8. 川普习近平会面谈什么?
  9. 中国油轮首度在霍尔木兹遇袭 甲板起火…
  10. 美国特勤局车辆现身北京街头:配备装甲 夜视 催泪气…
  11. 日本再砸5万亿日元护汇率
  12. 30亿人可能看不到世界杯?FIFA转播权为何卖不动?
  13. 两任中国防长同判死缓 学者:真正原因可能是“泄密”
  14. “习下蔡上”是把蔡奇放火上烤?接班人疑云引猜测
  15. 中植系落幕 旗下316家企业合并破产清算
  16. 广州全面取消限购未挽救楼市 分析:信心崩盘
  17. 魏凤和、李尚福通敌叛国? 分析:为张又侠罗织罪名
  18. 遗体全身器官消失 黑龙江两女童失踪案疑点重重
  19. 晨起第一杯水喝错伤身?这3种水千万别空腹喝
  20. 伊朗“尚未回应美方案”,美宣布新制裁
  21. 美从德国撤军超5千人 波兰总统:我们可以全接收
  22. 美军反击伊朗导弹无人机等袭击 川普回应
  23. 解散xAI ,马斯克和Anthropic都赢麻了
  24. 怕被美制裁波及?传中共急令银行停贷涉伊炼油厂
  25. 这国“强暴节”全球傻眼!女大生当街惨遭猥亵
  26. FOX招聘世界杯“首席观察员” 5万报酬看全部赛事
  27. 巴西对中国公民免签 飞里约热内卢搜索量瞬时翻倍
  28. 数据中心用电翻倍,吃下8.5%电力
  29. 重庆七年三名高官异常离世 诸多细节惊人雷同
  30. 美中央司令部:美军对伊朗发动报复性打击
  31. 罕见!最高法院公开对拜登提名的大法官严厉批评
  32. 纽约市长向富人征税 房产大亨怒:令人作呕
  33. 华邮:伊朗打击美军基地极为精准 战力超美方想像
  34. 汉坦病毒首发病荷兰夫妇活动轨迹披露 去了这三国
  35. 硅谷科技巨头如何助力中国的大规模监控?
  36. 巴西免签,搜索量瞬时翻倍
  37. 从受援国到调停人 巴基斯坦凭借什么突然掌控大局?
  38. 黑龙江两女童失踪多日后确认遇害
  39. 白宫新闻秘书官宣产女
  40. 前NASA科学家:“死后世界”很平静
  41. 【中国观察】中共大幅修订监狱法 藏何猫腻
  42. 顶刊论文造假 同济大学生命学院院长王平被撤职
  43. 传统周医学讲座 聚焦长寿秘诀与生医新知
  44. 台退役少校吕礼诗“媚中”最高裁罚50万
  45. 白宫新闻秘书莱维特官宣产女 晒照片并公布名字
  46. 推动与北京建交 所罗门群岛总理信任投票失败下台
  47. 美国为何有共产党议员?马克思诞辰日引爆争议
  48. 少女玩悬崖秋千坠亡!专家揭疑点:恐非“没绑紧”
  49. 沈火明任成都理工大学党委书记
  50. 女子玩“悬崖秋千”坠亡,目击者发声
  51. 呼应美国要求 新西兰拟引进英日护卫舰
  52. 毒枭留下的河马,这下有救了?
  53. 内娱“再就业”杀疯!明星演员扎堆卖艺?
  54. 美货车司机遭判死 唱圣诞歌勒毙女童 1小时录音令人崩溃
  55. 关键人物接连自杀,尹锡悦夫妇案有点神秘了
  56. 两男在英国帮中共监视香港异见者 被判有罪
  57. 魏凤和、李尚福以行贿受贿罪名分别被判处死缓
  58. 美贸易法院:川普10%的全球关税政策无效
  59. 美伊再爆冲突 油市震荡 布油涨破100美元
  60. 惊悚视频:弃婴还是被活摘?中国博主:死婴满山遍野