黄仁勋的新故事:"Agent工厂"里,装的是什么?

2026-06-01 20:26:14 · chineseheadlinenews.com · 来源: 腾讯科技

2026年6月1日,在COMPUTEX 2026期间举办的NVIDIA GTC Taipei大会上,英伟达创始人兼CEO黄仁勋发表主题演讲。

距离上一场GTC,不过三个月。

当时,英伟达发布了Vera Rubin的“芯片全家桶”,包括:Vera CPU、Rubin GPU、Groq 3 LPU、ConnectX-9、BlueField-4 DPU、Spectrum-6交换机,六颗芯片构成一台机架级AI超算,并宣告训练大型MoE模型所需GPU数量降至四分之一,推理吞吐量每瓦提升10倍,单token成本降至十分之一。

和之前强调“芯片全家桶”、“算力全家桶”这种系统级解决方案不同,三个月后COMPUTEX,黄仁勋把目光投向这些基础设施将服务目标——Agent。

黄仁勋在演讲中透露:Vera Rubin正式进入量产,Vera CPU开始向全球交付,DGX Station第一次以Windows形态走进企业桌面,Cosmos 3重构物理AI的感知框架,DSX成为AI工厂的运营操作系统。英伟达还联合宇树发布了H2 Plus——首款基于Isaac GR00T的人形机器人参考设计,把Agent的边界从数字世界延伸到物理形态。

英伟达正在围绕Agent生态,重新组织从芯片、数据中心、模型、软件到机器人平台的完整技术体系。

黄仁勋说:“Agent AI和实用型人工智能时代已经到来。现在token(也称‘词元’)是利润单位,AI是GDP‘生成器’,软件工程师的数量正在增加。人们谈论AI减少了工作岗位,这完全是胡说八道,实际上有更多的软件工程师正在被雇用”。

黄仁勋的新故事:"Agent工厂"里,装的是什么?

01 同样的AI工厂,跑出10倍Agent任务

Vera Rubin平台已全面投产。

与过去主要面向大模型训练和推理不同,Vera Rubin从设计之初就把Agent作为重点工作负载。

黄仁勋在演讲中表示,一个Agent任务往往不只是一次模型推理,而是包含推理、搜索、工具调用、代码执行和结果验证等多个环节,背后可能涉及数千个步骤。未来数据中心需要处理的,也不再只是单个模型请求,更多的是大量持续运行、相互协作的Agent任务。

该平台被定义为一个巨大的、统一的计算单元级AI超级计算机,专为处理从推理、检索到工具使用的智能体工作负载而构建。在同样规模的超大型数据中心里,用全新的 Vera Rubin 平台来运行自主 AI 智能体的任务,其处理效率是上一代 Grace Blackwell平台的 10 倍。

除了计算平台本身,网络也成为Vera Rubin升级的重点之一。

过去数据中心里,GPU之间的数据传输主要依赖传统光模块和交换机架构,但当集群规模持续扩大后,功耗、散热和部署复杂度都会快速上升。为此,英伟达在Vera Rubin平台中引入了Spectrum-X Ethernet Photonics网络系统

这是英伟达首次将共封装光学(CPO)技术大规模引入AI数据中心网络

简单来说,传统方案需要把光模块插在交换机外部,而CPO则直接把光学器件集成到交换机内部,从而减少能耗和信号损失。

此外,安全也是此次Vera Rubin平台重点强调的核心能力。

为此,英伟达将机密计算(Confidential Computing)能力扩展到整个Vera Rubin平台。通过可信执行环境、硬件级验证以及端到端加密机制,企业能够在处理私有数据、行业敏感信息和关键模型时获得更高等级的安全保障。

黄仁勋透露,Vera Rubin已经进入量产阶段。作为第三代MGX机架级系统,其背后涉及超过150家合作伙伴、350多座工厂以及覆盖30多个国家和地区的供应链体系。按照英伟达公布的计划,Vera Rubin将于今年秋季开始正式出货。



02 “为Agent而生”的处理器

英伟达推出了专为智能体时代设计的新型处理器Vera,并已全面投产。

黄仁勋指出,内存系统的进步将推动存储系统进行创新和现代化升级。至今为止的所有CPU都是为人类打造的,而Vera是为AI时代设计的CPU,为智能体打造。

作为Grace的继任者,Vera采用了英伟达自主设计的“Olympus” CPU核心架构,核心数量从72个提升至88个,并大幅提高内存和数据处理能力。据英伟达介绍,在Agent相关工作负载测试中,Vera的任务执行速度达到同期x86服务器CPU的1.8倍。

相比单纯的性能提升,更重要的变化在于Vera与Rubin GPU之间的关系:Vera通过第二代NVLink-C2C与Rubin GPU连接,互联带宽达到1.8TB/s,Agent运行过程中在CPU和GPU之间传递数据的开销进一步降低。

黄仁勋表示,Vera Rubin采用美光、SK海力士和三星的HBM(高带宽内存),供应链规模是上一代Blackwell的“两倍”。不过,部署一个大型Blackwell机架需要两个小时,而Vera Rubin的时间被压缩到5分钟级别。



03 让AI工厂从“建设”走向“运营”

NVIDIA这次推出的DSX,可以理解为一套“AI工厂建设和运营工具箱”。

过去建设AI数据中心,客户需要分别考虑服务器、网络、电力、冷却、机房设计和运维系统,很多环节依赖不同供应商协同。DSX要做的,是把这些原本分散的环节放到同一个框架里,让客户从设计、仿真、建设到运营,都有一套可参考、可验证的标准方案。

黄仁勋在发布会现场表示:NVIDIA不只是卖芯片,而是要给基础设施建设者一套完整的AI工厂蓝图。

这次DSX最重要的新增能力主要有两个:

第一个是DSX MaxLPS。它解决的是AI工厂最现实的问题:在电力预算固定的情况下,如何放下更多GPU、跑出更多Token。

按照英伟达的说法,MaxLPS结合液冷和机架内功耗优化,可以让运营商在不明显影响性能的情况下,多运行最多40%的GPU。

第二个是DSX OS。它相当于AI工厂的运营软件,负责生命周期管理、智能调度、健康监测、故障恢复、多租户管理等工作。简单来说,如果AI工厂是一座复杂工厂,DSX OS负责让这座工厂持续稳定运转。

在DSX的产品矩阵当中,Reference Design提供AI工厂参考设计,告诉客户机房、机架、网络、电力和冷却系统应该如何搭建;DSX Sim负责仿真,让客户在建设前先验证设计是否可行;DSX Flex把AI工厂和电网连接起来,让数据中心可以根据电价、负荷和需求响应信号调整任务;DSX Exchange则负责打通IT系统、运营系统、能源和冷却系统之间的数据接口。

在生态系统方面,CoreWeave、Crusoe、Lambda等云合作伙伴正部署DSX Sim、MaxLPS和DSX OS以降低风险并提高GPU利用率。戴尔、HPE、联想、Supermicro以及华硕、富士康、技嘉、云达科技等制造商正构建支持DSX的系统。

04 与Windows和ARM抱团

现场演讲中,黄仁勋官宣“DGX Station for Windows”工作站登台亮相,被英伟达定义为面向Windows生态的桌面级AI超级计算机。

硬件上,它搭载GB300 Grace Blackwell Ultra Desktop Superchip,通过NVLink-C2C连接Blackwell Ultra GPU与72核Grace CPU,最高提供748GB统一内存和20 PFLOPS FP4性能,并配备最高800Gb/s网络能力。

这款产品的重点在于Agent部署方式的变化。

英伟达希望企业能够在本地、安全、可管理的Windows环境中运行多个Agent,并将其接入设计、工程、数据科学、推理和Physical AI等工作流。同步推出的OpenShell负责Agent运行安全,通过隔离沙箱和系统级策略控制,限制Agent越权操作或泄露凭证、私有数据。

除了面向企业桌面的产品,黄仁勋还在会上发了一颗系统级SoC——RTX Spark SoC,把N1X CPU和Blackwell GPU做进了一块芯片上,统一内存架构,专门给轻薄笔记本和小型台式机用。

其中,N1X是英伟达与微软共同打造的首款PC处理器,它基于Arm架构,由联发科定制设计,台积电3纳米工艺制造。今秋首发搭载于微软、戴尔、惠普、华硕、联想和微星的笔记本,首批超过30款机型,主打高端轻薄本。

这是英伟达为AI PC时代准备的“超级芯”,黄仁勋把它视为PC形态的一次重要重构。

05 Agent的“两个大脑”



这次发布会上,英伟达公布了两条核心模型产品线的最新进展,分别对应Agent的两个场景:一个跑在企业系统里,一个跑在物理世界中。

英伟达发布了一款拥有 5500 亿参数的混合专家模型Nemotron 3 Ultra,可为代码开发、科研及企业业务流程中的长效智能体提供顶尖智能能力。相较于同级别主流开源前沿模型,该模型推理速度最高提升 5 倍,使用成本最高降低 30%,助力智能体更高效、低成本地完成各项任务。

围绕Nemotron开放模型,英伟达发布了一系列软件、开源模型和合作进展,目标是让企业在工程设计、医疗健康、软件开发和业务运营等场景中,构建能够协助员工工作的“数字同事”。

这套组合里,Nemotron提供基础模型能力,NemoClaw负责把模型组织成Agent,OpenShell负责运行时安全,Agent Toolkit则把CUDA-X等英伟达软件库变成Agent可以直接调用的工具。Agent可以在受控环境中使用工具、调用数据、执行任务,并接入企业现有系统。

黄仁勋表示,全球软件公司正在把AI Agent带入真实工作系统,让它们帮助员工更快完成复杂任务。NemoClaw提供了构建长期运行Agent所需的开放组件,包括编排、上下文、记忆、工具调用和安全控制等能力。

过去企业讨论AI,更多关注模型能回答什么;现在英伟达要解决的是,Agent如何安全地接入工具、数据和业务流程,并在真实工作中持续运行。

还有Cosmos 3,作为Cosmos系列的第三代正式发布,也是一次架构层面的重构。

Cosmos 3是一个面向物理AI的世界基础模型,提供“理解物理世界、预测会发生什么、决定怎么做”的底层能力。

和此前的Cosmos相比,早期版本主要面向机器人和自动驾驶开发者,做的是视频生成和物理世界模拟,本质上是个相对单模态的生成框架。Cosmos 3换了一套架构——混合Transformer,首次把视觉推理、世界生成和动作预测三件事统一到了一个系统里。

它能原生理解并生成文本、图像、视频、环境声音和动作,在物理准确性上达到领先水平,是全球首个完全开放的全能模型。英伟达称,它有望把物理AI的训练和评估周期从过去的数月压缩到数天。

黄仁勋预测,得益于多模态推理语言、视觉和世界模型的突破,物理AI的大爆炸即将来临。

Cosmos 3系列开放的前沿全能模型为开发者提供了代际飞跃的能力,用于构建能够在物理世界中感知、推理、规划和行动的机器人、自动驾驶汽车和视觉AI。

06 降低Physical AI门槛

英伟达还联合宇树发布了H2 Plus:—首款基于Isaac GR00T的人形机器人参考设计。通俗来讲,它更像是一台面向研究和开发者的“开发样机”。

宇树负责机器人本体,英伟达负责软件和计算平台,两边把硬件和软件预先整合好,开发团队拿到就能直接开始做技能开发,不用自己再花时间解决底层对接问题。它也是全球首款基于NVIDIA Isaac GR00T开发平台构建的开放式人形机器人。

这款设计,瞄准的是人形机器人开发中一个长期存在的痛点:硬件集成、数据采集、仿真、训练、评估、部署,各环节各自为战,整个流程高度碎片化。

英伟达表示,研究团队拿到一个机器人本体,往往要花大量时间在底层拼凑上,真正的技能开发反而被一再推后。H2 Plus尝试做的事,就是把这条路打通,让研究团队跳过底层集成,直接进入技能开发和真实场景验证。

在黄仁勋看来,人形机器人将为全球最大的产业带来物理AI,开启数万亿美元的经济机遇,而H2 Plus就是把前沿研究往工厂、仓库、物流系统这些真实场景推进的起点。

此外,英伟达还宣布,正式开源一套物理AI Skills(技能)工具集,覆盖机器人、自动驾驶、视觉AI和工业数字孪生等核心场景。

所谓“技能”,可以理解为英伟达把自己旗下的Cosmos、Omniverse、Isaac、Metropolis等平台的使用方式标准化之后,写成了智能体可以直接读懂、直接执行的操作指令,这些指令打包开源出来,就是这次发布的工具集。

智能体接到一个任务,比如生成一批检测缺陷的训练数据,它就知道该调用哪个模型、输出什么格式、怎么验证结果,整个过程自动跑完,不需要人一步步去操作每个环节。

07 升级AI存储:从“跑得快”到“管得住”

在3月份的圣何塞GTC上,英伟达发布了Vera BlueField-4 STX,当时黄仁勋重点讲的是“AI原生存储架构”,核心卖点是为智能体长上下文推理提供高性能KV Cache存储支撑。

现在,英伟达在STX基础上宣布新增一套安全能力,重点从“存储性能”变成了“存储安全”。

这里的核心逻辑和思考,是因为背景是企业AI的使用方式在变化。现在很多企业都积极部署智能体,当Agent接入企业系统,在无人直接监督的情况下持续读写、跨系统共享信息——谁在访问什么数据、有没有越权、有没有泄露,这都是企业头疼的问题。

英伟达的解法是,在加速存储的基础上加了一层安全能力——靠着一套统一的 NVIDIA DOCA 安全软件,以及在 BlueField-4 芯片里直接硬性执行策略,基于 STX 的平台可以实时检查和管控代理、数据和上下文记忆之间的互动,帮企业在 AI 数据路径上实现持续的策略执行。

黄仁勋解释称:“智能体把企业数据变成了一个实时、活生生的系统,而这个系统必须在数据移动之处、上下文存储之处、智能体行动之处都得到保护。Vera BlueField-4 STX要做的,就是用天生安全的设计,在芯片中以AI的速度执行信任”。

08 与台积电“互为供应商”

这次大会中,非常有意思的一个点是英伟达和台积电的合作——目前,台积电正利用NVIDIA技术提升先进晶圆厂的周转时间、能效、良率与运营生产力。

台积电和英伟达的关系,过去三十年只有一种形态:台积电帮英伟达造芯片。但现在,角色发生了微妙的变化,英伟达开始帮台积电“管工厂”。

黄仁勋表示:“英伟达和台积电已合作近三十年,不断推动计算的极限。台积电正在将英伟达的AI和加速计算引入晶圆厂内部,通过仿真、优化和AI应对全球最复杂的设计和制造挑战,以提高下一代芯片的速度、效率和良率。”

两者的关系,从单向的甲乙方,变成了双向的相互依存。

结语

回看这场发布会,英伟达正在围绕“Agent”拼凑新的蓝图。

Vera CPU为Agent调度任务,Vera Rubin为Agent提供算力,BlueField-4 STX为Agent守住数据安全,Cosmos 3让Agent理解物理世界,Nemotron+NemoClaw+OpenShell让Agent可以被组织、被调用、被约束,DGX Station for Windows让Agent进入企业员工的桌面,H2 Plus让Agent拥有身体,DSX和Skills让这一切可以被批量生产、批量部署。

从这个角度看,黄仁勋试图描绘的是一个新的计算时代。这也呼应了他在开场提到的“Agent AI和实用型人工智能时代已经到来”。

归根结底,黄仁勋这次想讲的就是一件事:当Agent成为AI基础设施,每一层都能有英伟达。


    24小时新闻排行榜更多>>
  1. 海底发现的人类古文明遗址
  2. 美军助4分之1受困船通过霍尔木兹 幕后手法曝光
  3. 山东鸡蛋兽药残留超标69倍 河南猪肉抗生素超标37倍
  4. 步拜登后尘?川普体检结果出炉 认知检测分数公开
  5. 三孩政策第五年,走不出计划生育的人
  6. ICE凌晨突袭华人海鲜酒楼 16人被带走 背后牵出大案
  7. 美军摧毁伊朗防空系统 德黑兰称进行报复
  8. HONDA到了生死边缘,上市69年首次出现巨额亏损
  9. 埃克森美孚高层预警:每桶160美元“不是梦”
  10. 常常“闪到腰”?几招教你矫正不良姿势
  11. 最伤气血的四件事 很多人每天都在做
  12. 中国发布无人机“团灭”算法 6.6毫秒决策 100%杀伤率
  13. 免开冷气 实用又不花钱的“室内降温法”
  14. 老翁高楼悬空,举手机对准邻居家
  15. 传说中的5种穷人思维,你中了几个?
  16. 耿同学打假后效应 《柳叶刀》查出3000余篇论文 涉嫌AI生成或虚构
  17. 川普币、川普钞、川普护照,美国还剩多少美国?
  18. 重庆反共标语事件勇士戚洪 在英遭亲共口译员斥责
  19. 道士和尚纷纷送外卖开网约车 背后是谋生难…
  20. 台湾半导体经济起飞,但却存在年轻世代经济困境
  21. 250建国周年音乐会爆明星退演潮 川普怒呛三流艺人
  22. 中国外卖骑手超编1600万人 网约车市场亦饱和
  23. 哈佛最年轻华人教授入职OpenAI 但可能没那么简单…
  24. 华人老板突失联!大巴惨剧5死44伤 联邦调查发现…
  25. 摩根大通:本轮存储超级周期将“更高、更长”
  26. 习“雄安看门人”被免职 新任保定书记是李克强旧部
  27. "六四"前夕 纪念馆遭破坏 王丹:作案动机不难想像
  28. 亚裔男刑满30年面临遣返 曾登上“全美头号通缉犯”
  29. “天安门母亲”呼吁习近平秉持胡耀邦精神“有错必纠”
  30. 中共得罪硬茬了 摩萨德秘密行动细节首次曝光
  31. 零州税最吸引人!美国人正集体逃离 投奔这些州
  32. 中共纵容童工现象滋生 强制中职生实习日工时达12小时
  33. 售卖用户手机内文物照 中国交易平台闲鱼道歉
  34. 这场“香会”带给人们哪些信息和启示?
  35. 川普: 前往黎巴嫩部队已召回 与真主党通话顺利
  36. 郑丽文踏上访美行程
  37. 华尔街顶尖分析师:这三只股票增长潜力强劲
  38. 台商走了!埃建“台湾小镇”一夜间空了!惨状惊人!
  39. 1.2万亿美元,中国将有大麻烦
  40. 坐实?外媒惊爆习近平“欲培养郑丽文选2028总统”
  41. 美国要打巴基斯坦?
  42. 美国股市真没泡沫?繁荣背后藏着一个危险真相
  43. 5月,上海二手房成交超2.8万套
  44. 国内彩票销售全面下滑的背后
  45. 马斯克招中文人才 训练Grok中文语音 全球可申请
  46. 天安门母亲:“六四”惨案三十七周年祭
  47. 湖北官场震荡 原武汉市长周先旺大管家被查
  48. 美核武实验员失踪近1年,寻获遗骸
  49. 波士顿上空巨响,由流星爆炸引发
  50. 一份外卖撕开女白领 老板与幕后“大老板”真面目
  51. 梦露遗物首拍,信件曝光其生命最后一天
  52. 美国找到无需花费百万美元即可击落无人机的方法
  53. 习近平指示:以超常规措施解决“卡脖子问题”
  54. 伊朗据报停止与美谈判 川普怎么说
  55. 马云“密友”一手导演,散户血本无归?
  56. 美当局从一中餐馆查获多种毒品 逮捕16人
  57. 习“统一台湾”底牌被揭 美议员讽像“怀孕的修女”
  58. 科学研究灵魂离体和通灵现象
  59. 从7块到700亿:湖南打工妹,已成女首富
  60. 玛丽莲梦露百岁诞辰 加州千人扮女神经典造型致敬