英伟达宣布下一代人工智能芯片全面投产
2026-01-06 20:26:05 · chineseheadlinenews.com · 来源: 看中国

英伟达(Nvidia)首席执行官黄仁勋(Jensen Huang)。(图片来源:Ethan Miller/Getty Images)
周一(1月5日),英伟达(Nvidia)首席执行官黄仁勋(Jensen Huang)在拉斯维加斯举行的国际消费电子展(CES)上表示,公司下一代人工智能芯片已进入全面投产阶段,并预计将在今年晚些时候推出。
黄仁勋介绍,新一代芯片在为聊天机器人等AI应用提供服务时,计算能力可达到上一代产品的五倍。
英伟达高管向路透社证实,相关芯片已进入公司实验室,并由多家人工智能企业进行测试。
英伟达即将推出的平台名为Vera Rubin,由六款不同芯片组成。其旗舰服务器将配备72个英伟达图形处理单元(GPU)以及36个全新的中央处理器(CPU)。并可通过“pods”系统架构进行整合,每个系统最多可连接超过1,000枚Rubin芯片。
黄仁勋表示,这种架构可将AI系统中“令牌(tokens)”的生成效率提升10倍。“令牌”是AI模型处理和生成信息的基本单位。
不过,他也指出,这一性能提升依赖英伟达自有的数据格式,公司希望未来能被更多行业参与者采用。
他强调,虽然新芯片的晶体管数量仅增加约1.6倍,但通过架构和技术优化,整体性能仍实现了大幅跃升。
目前,英伟达在AI模型训练领域仍占据主导地位,但在AI推理和大规模应用阶段,其面临的竞争正在加剧。对手既包括超威半导体(AMD)等传统芯片厂商,也包括部分客户自研芯片,例如Alphabet旗下的谷歌。
针对AI应用场景,英伟达在新一代芯片中引入“上下文内存存储(context memory storage)”技术,用于提升聊天机器人在处理长问题和复杂对话时的响应速度。
在网络设备方面,英伟达同时发布了新一代网络交换机,采用“共封装光学(co-packaged optics)”连接技术,被认为是支持大规模计算系统互联的关键方案之一。英伟达的新产品将与博通(Broadcom)及思科系统公司(Cisco)的相关产品展开竞争。
英伟达表示,云计算公司CoreWeave将成为首批部署Vera Rubin系统的企业之一。微软、甲骨文、亚马逊以及Alphabet也预计将采用该系统。
此外,黄仁勋还介绍了英伟达在自动驾驶软件方面的进展。该软件不仅可帮助车辆实时作出行驶决策,还能在事后向工程师完整回溯决策过程。
英伟达此前展示的“Alpamayo”研究成果将更广泛发布,用于训练的软件数据也将对外开放,供汽车制造商评估。黄仁勋称,英伟达将同时开源模型和训练数据,以增强外界信任。
在并购方面,英伟达上个月从初创公司Groq收购了一批芯片技术及相关人才,其中包括曾参与谷歌自研AI芯片设计的高管。尽管谷歌仍是英伟达的重要客户,但随着其自研芯片推进,相关产品已成为英伟达在人工智能芯片领域面临的重要竞争因素之一。
在与金融分析师的问答环节中,黄仁勋表示,收购Groq的交易不会影响英伟达的核心业务,但可能推动公司推出新的产品,进一步拓展产品布局。
与此同时,英伟达强调,新产品性能已明显超过包括H200在内的旧款芯片。
去年12月8日,美国总统川普(川普)宣布,允许H200芯片出口至中国。美国政府会向英伟达收取25%的销售提成。H200芯片比之前获准出口中国的H20芯片的档次更高,但并非英伟达的顶级产品。
路透社报道称,作为英伟达现有“Blackwell”芯片的前一代产品,H200在中国市场需求强劲,这一情况引发了美国政界对华强硬人士的关注。
黄仁勋在与分析师交流时表示,H200在中国的需求仍然旺盛。英伟达首席财务官克雷斯(Colette Kress)则称,公司已向相关部门申请出口许可,仍在等待美国及其他政府的审批结果。