亚马逊最新AI芯片,挑战英伟达和谷歌

2025-12-02 11:25:13 · chineseheadlinenews.com · 来源: 华尔街日报

Trainium 3是首款3nm AWS AI芯片,提供2.52 PFLOPs FP8算力,内存容量较前代增加1.5倍、带宽提升1.7倍,搭载它的Trn3 UltraServer系统能效较前代提高40%。开发中的Trainium 4将支持英伟达NVLink Fusion互联技术。新模型包括亚马逊最智能推理模型Nova 2 Pro和业内首款统一的多模态推理和生成模型Nova 2 Omni。开创"开放式训练"模式的服务Nova Forge为企业构建定制Nova模型。新服务Nova Act实现浏览器任务自动化突破。更新中

美东时间12月2日周二,亚马逊云计算部门AWS在年度云计算盛会re:Invent上推出新一代人工智能(AI)训练芯片Trainium 3,预告了下一代产品Trainium 4的开发计划,加大力度挑战英伟达和谷歌在AI芯片市场的主导地位,同时推出Nova 2系列模型和全新AI服务,试图在激烈的AI竞争中抢占更多市场份额。

AWS宣布,Trainium 3芯片已于近期部署至少数几个数据中心,并从本周二当天起向客户开放使用。AWS的副总裁Dave Brown表示:“进入明年初,我们将开始非常非常快速地扩大规模。”

这款芯片的推出速度超出业界常规。亚马逊在部署前一代加速器约一年后便发布了Trainium 3,与英伟达承诺的每年发布新芯片的快节奏相当。

亚马逊希望吸引寻求性价比的公司。公司宣称,Trainium芯片能以比英伟达市场领先的图形处理单元(GPU)更低廉和高效的方式,为AI模型背后的密集计算提供动力。Brown表示:"我们对Trainium实现正确的价格性能比的能力感到非常满意。"

亚马逊周二不仅发布了四款新模型,还推出了业内首创的"开放式训练"服务Nova Forge,并发布了专注于浏览器任务自动化的代理服务Nova Act。此次发布的Nova 2家族涵盖推理、多模态处理、对话式AI和代码生成等多个领域,主打价格性能比优势。

新AI芯片的消息公布后,亚马逊股价逼近239美元刷新日高,日内涨幅扩大到将近2.2%,而盘初曾涨3.2%的英伟达股价进一步收窄涨幅,美股早盘尾声时刷新日低,几乎抹平所有涨幅。其竞争对手AMD的股价也刷新日低,日内跌近1.7%。

Trainium 3性能大幅跃升

AWS称,其第四代 AI 芯片Trainium 3是首款3纳米(nm)制程的AWS AI芯片,专为下一代智能体、推理和视频生成应用程序App提供最佳代币经济效益而打造。

据AWS官方数据,搭载Trainium 3芯片的Trn3 UltraServer系统在训练和推理性能上都实现了显著提升。相比第二代产品,新系统速度提升超过4倍,内存容量增加4倍。

每颗Trainium 3芯片提供2.52千万亿次浮点运算(PFLOPs)的FP8算力,内存容量较Trainium 2增加1.5倍至144GB HBM3e,内存带宽提升1.7倍至4.9TB/s。单台完整配置的Trn3 UltraServer可容纳144颗芯片,总算力达362 PFLOPs,并提供高达20.7TB的HBM3e内存和706TB/s的聚合内存带宽。

能效提升同样引人注目。AWS表示,Trn3 UltraServer的能效比前代产品提高40%,性能功耗比提升4倍。在Amazon Bedrock平台上,Trainium 3成为AWS最快的加速器,性能较Trainium 2提升3倍,每兆瓦输出token数量增加超过5倍,且延迟水平相当。

Brown在采访中表示:"我们对Trainium在价格性能方面的表现非常满意。"该系统还可在EC2 UltraClusters 3.0中扩展至数十万颗芯片,AWS称其目标是年底前为AI初创公司Anthropic提供100万颗芯片。

Trainium 4将支持英伟达互联技术

亚马逊在会上还预告了正在开发中的Trainium 4芯片。这款下一代产品将带来性能的重大跃升,并将支持英伟达的NVLink Fusion高速芯片互联技术。

这一技术兼容性意味着,搭载Trainium 4的AWS系统将能够与英伟达GPU互操作并扩展性能,同时仍使用亚马逊自研的低成本服务器机架技术。这可能帮助AWS吸引那些基于英伟达GPU开发的大型AI应用迁移至亚马逊云平台。

值得注意的是,英伟达的CUDA架构已成为所有主流AI应用支持的事实标准。Trainium 4对NVLink的支持或将降低这些应用转向AWS的技术门槛。

亚马逊未公布Trainium 4的具体发布时间表。按照以往发布节奏,外界预计将在明年的re:Invent大会上获得更多信息。

软件生态仍是短板

尽管硬件性能强劲,亚马逊芯片仍面临生态系统挑战。与英伟达相比,AWS芯片缺乏帮助客户快速部署的深度软件库。

建筑设备自动驾驶公司Bedrock Robotics的首席技术官Kevin Peterson表示,虽然该公司在AWS服务器上运行基础设施,但在构建指导挖掘机的模型时仍使用英伟达芯片。"我们需要它性能强大且易于使用,"Peterson说,"那就是英伟达。"

目前使用Trainium芯片的主要客户是Anthropic,这些芯片分布在印第安纳州、密西西比州和宾夕法尼亚州的数据中心。AWS今年早些时候表示,已将超过50万颗芯片串联起来帮助Anthropic训练最新模型,,并计划在年底前为这家OpenAI的劲敌提供100万颗芯片。

不过Anthropic同时也在使用谷歌的TPU(张量处理单元),并在今年早些时候与谷歌达成协议,获得价值数百亿美元的计算资源。

除Anthropic外,亚马逊公布的其他主要客户寥寥,令分析师难以评估Trainium的实际效果。AWS表示,日本的LLM Karakuri、Splashmusic和Decart等客户已在使用第三代Trainium芯片和系统,并显著降低了推理成本。

AWS承诺通过AWS Neuron SDK和原生PyTorch集成,让开发者无需更改任何模型代码即可进行训练和部署,试图以此缩小与英伟达的软件生态差距。

四款Nova 2模型各有侧重

亚马逊此次推出的四款Nova 2模型针对不同应用场景设计。Nova 2 Lite是一款快速、经济的推理模型,专为日常工作负载设计,可处理文本、图像和视频并生成文本。在与竞争对手的基准测试对比中,该模型在15项测试中有13项表现优于或持平Claude Haiku 4.5,在17项测试中有11项优于或持平GPT-5 Mini。

Nova 2 Pro是亚马逊最智能的推理模型,可处理文本、图像、视频和语音并生成文本,适用于代理编码、长期规划等高度复杂任务。该模型在与Claude Sonnet 4.5的16项基准测试中有10项表现更优或持平,与GPT-5.1的16项测试中有8项更优或持平,与Gemini 2.5 Pro的19项测试中有15项更优或持平。

Nova 2 Sonic是亚马逊的语音到语音模型,统一了文本和语音理解及生成功能,支持实时、类人对话式AI。该模型拥有100万个token的上下文窗口,支持扩展的多语言功能,并可与Amazon Connect、Vonage、Twilio等电话服务提供商无缝集成。

Nova 2 Omni是业内首款统一的多模态推理和生成模型,可处理文本、图像、视频和语音输入,同时生成文本和图像。该模型可同时处理多达75万个单词、数小时音频、长视频和数百页文档,一次性分析整个产品目录、客户评价、品牌指南和视频库。

Nova Forge开创"开放式训练"模式

Nova Forge是AWS推出的首创服务,让企业能够构建自己的Nova模型定制版本——亚马逊称之为"Novellas"。该服务开创了"开放式训练"模式,为客户提供对预训练、中期训练和后训练Nova模型检查点的独家访问权限,使客户能够在模型训练的每个阶段将专有数据与亚马逊Nova策划的数据集混合。

这一服务解决了企业在将专有知识嵌入AI应用时面临的三大难题:定制专有模型时整合深度有限、继续训练开源权重模型时缺乏原始训练数据访问权限,或从零开始构建模型成本高昂。

除了模型检查点和数据混合能力,Nova Forge还提供三项核心功能:使用客户自己的环境(称为强化学习"gyms")训练AI的能力,创建更小、更快模型的选项,以及实施安全控制的负责任AI工具包。

Reddit正在使用Nova Forge改进内容审核系统。Reddit首席技术官Chris Slowe表示:"我们正在用单一、更准确的解决方案替代多个不同的模型,使审核更加高效。用一种统一的方法替代多个专门的机器学习工作流程,标志着我们在Reddit上实施和扩展AI方式的转变。"

Booking.com、Cosine AI、Nimbus Therapeutics、野村综合研究所、OpenBabylon和索尼等公司也在使用Nova Forge构建自己的模型。客户使用Nova Forge创建的模型可以部署在Amazon Bedrock上,享有与其他Bedrock模型相同的企业级安全性、可扩展性和数据隐私保护。

Nova Act实现浏览器任务自动化突破

Nova Act是AWS推出的新服务,用于构建和部署能在网络浏览器中执行操作的高可靠性AI代理。该服务由定制的Nova 2 Lite模型驱动,为构建和管理自动化浏览器任务的代理提供最快、最简便的路径。Nova Act在早期客户工作流程中实现了90%的可靠性,并在相关基准测试中表现优于竞争模型。

Nova Act通过强化学习训练定制的Nova 2 Lite模型,在数百个模拟网络环境中运行数千项任务,从而实现突破性可靠性。这种训练方式使Nova Act在基于用户界面的工作流程中表现出色,例如更新客户关系管理系统中的数据、测试网站功能或提交健康保险索赔。

开发人员可以在几分钟内使用无代码平台通过自然语言提示开始原型设计,然后在VS Code等熟悉的集成开发环境中完善代理,最后部署到AWS。客户在本地构建和测试的内容可以在生产环境中扩展,并通过Nova Act AWS控制台获得全面的管理工具和监控。

亚马逊介绍,多家企业已经注意到Nova Act的成效。其中,初创公司Sola Systems集成Nova Act后,每月为客户自动化数十万个工作流程,涵盖对账支付、协调货运和更新医疗记录等关键业务任务。

1Password使用Nova Act减少用户访问登录信息的手动步骤,只需一个简单提示即可在数百个不同网站上自动工作。Hertz通过使用Nova Act自动化其租赁平台的端到端测试,将软件交付速度提高了5倍,消除了质量保证瓶颈,将原本需要数周的工作缩短至数小时。


    24小时新闻排行榜更多>>
  1. 中共党媒批政绩工程 分析指党魁本人最尴尬
  2. 中国国债——全球唯一避风港
  3. 全球户储大周期来了
  4. 隐私泄露:买药反被注销驾照?
  5. 中国第一代女赛车手,40岁决定去开网约车
  6. 坚持吃红薯,身体或迎3改善
  7. 买安眠药收注销驾照短信,个人隐私得加把锁
  8. 从禁飞到禁售 北京市无人机管控全面升级
  9. “碰一碰”的童年:儿童手表里的社交小世界
  10. 春日这4双“鞋子”最百搭
  11. 投资AI太烧钱?甲骨文爆大裁员“数千人丢饭碗”
  12. 河北一中学党委书记性侵高一女生 详情曝光
  13. 怪兽级融资:OpenAI一锤砸出8520亿
  14. 内存价格追踪:DDR3稳定上涨
  15. 马斯克:定制订单已结束
  16. “张雪”夺冠背后,是中国人的极致浪漫
  17. “超级厄尔尼诺”言之尚早
  18. 50万行代码泄露:揭开Claude好用秘密
  19. 美国计划4月2日发射载人绕月飞船
  20. 英核潜艇舰长辞职 疑涉议员丈夫中共间谍案
  21. 一对夫妇窃取研究秘密与中国分享,被取消美国身份
  22. 21岁大学生龚永成遭四川嘉州监狱严管迫害
  23. 韩前总理:中共是中国移民激增的幕后推手
  24. 伊朗:已向调解方表达立场
  25. 科技业寒冬?这家大厂惊传全球裁员3万 员工崩溃
  26. 3月电车销量:比亚迪稳了,蔚来爆了
  27. 伊朗战争添风险,亚洲外劳纠结应否在波斯湾"拼命"
  28. 俄加速断网封网 各地爆抗议 纸地图热销
  29. 细思极恐——中国籍博士后被FBI约谈后跳楼自杀
  30. 月薪6万招不到人,普通人的时代红利来了?
  31. 伊朗:将苹果、谷歌、特斯拉列为打击目标
  32. 马姆达尼宣布撤销市政府对TikTok的禁令
  33. 糖尿病患者吃咸鸭蛋,或许会有4变化
  34. 突如其来!甲骨文狠裁3万人 亲历一觉醒来“被失业”…
  35. 资深政治学家:习反腐与解放军高层重创的后果
  36. 中国茶饮“霸王茶姬”2025年净利润腰斩
  37. 迁怒于她!川普反手点名莱维特:要不要把她开了
  38. 意大利男足,脸都不要了?
  39. 阿联酋愿参战,助美打通霍尔木兹
  40. 一涉游民收容所贿赂案曝光 4人被起诉
  41. 人情冷暖,世态炎凉
  42. AI撰写的科研论文通过了同行评审
  43. 加州最危险4地,天黑后避免前往
  44. 4名以军侦察兵被打死,包括上尉队长
  45. 目击者揭:北京集市推土车撞人惨案内情
  46. 重庆一小区高空大量抛撒百元大钞 引关注
  47. 卢比奥:美国已看到伊朗战争的“终点”
  48. 第82空降师已抵达,三航母态势渐成
  49. 福特女儿收入曝光,网友破防
  50. 专家解读:美国取消出生公民权将意味着什么?
  51. 研究:砸钱赴美读"3科系"血本无归!薪水翻倍靠这行
  52. 武汉“萝卜快跑”系统瘫痪 百辆自驾车熄火
  53. 万斯告知伊朗战争斡旋国 川普耐心已尽
  54. 金与正“转正”了,朝鲜前总理变成了副总理
  55. 味好美将以448亿美元收购联合利华食品业务
  56. 香港至上海的高铁内蚊虫泛滥 有乘客提前下车
  57. 召回:2款壮阳巧克力含未申报成分
  58. 香港开往上海高铁蚊子满天飞 有乘客提前下车
  59. 美官员:应直接与伊朗谈判
  60. 伊朗的“麻省理工学院”遭严重破坏