亚马逊技术大会强势来袭:自研芯片性能暴增4.4倍

2025-12-02 19:26:32 · chineseheadlinenews.com · 来源: 腾讯科技

亚马逊技术大会强势来袭:自研芯片性能暴增4.4倍

当地时间12月2日,亚马逊云计算部门AWS的年度技术盛会re:Invent 2025在美国拉斯维加斯正式开幕。

大会首日,AWS一口气发布了Trainium 3自研AI芯片、Trainium 4路线图、AI工厂(AI Factory)主权云服务、Nova 2系列四大基础模型、Nova Forge开放式模型定制平台以及Bedrock AgentCore智能体工程化平台等一系列产品,系统构建起“芯片—模型—智能体—混合云”的全栈AI生态。

这场全球最具影响力的云与AI盛会恰逢人工智能产业从技术爆发期迈向规模化应用期的关键节点。头部企业持续加码算力,传统行业对AI的需求已从“尝鲜式”试点转向“刚需式”深度应用,数据主权、算力成本、生态兼容性等现实难题日益凸显。AWS此次没有进行零散的产品迭代,而是推出深度融合的全栈AI基础设施与服务体系,以成本优化、生态开放、合规适配三大核心优势,效仿谷歌直击行业痛点,强势抢占全球AI算力、模型与云服务市场的战略制高点。

AWS首席执行官马特·加尔曼(Matt Garman)在开幕主题演讲中做出重磅判断:“智能体AI(Agentic AI)将成为企业真正释放AI价值的关键,未来贡献占比将达80%至90%。”他指出,当前企业AI应用普遍面临碎片化困境:算力成本高企、模型难以深度适配业务、智能体部署缺乏标准化工具,导致技术与商业价值之间存在巨大鸿沟。

此次全线新品正是围绕“智能体优先”这一核心愿景打造的全链路战略部署,标志着AWS正式完成从传统云服务提供商向智能体AI生态构建者的转型,致力于用全栈能力彻底打通AI落地的“最后一公里”。

01.硬件突破:Trainium 3性能提升4.4倍,未来将兼容英伟达NVLink Fusion技术



Trainium 3芯片

作为AI生态最底层的基石,AWS在定制芯片领域的深耕已持续多年。目前其定制芯片业务规模已达数十亿美元,Trainium系列芯片全球部署总量突破100万张,成为支撑超大规模AI计算的核心支柱,在全球云厂商自研芯片中仅次于谷歌TPU。

此次发布的Trainium 3芯片采用台积电3纳米制程工艺,专为“推理主导”的时代量身打造。随着大模型训练逐步向少数头部玩家集中,广大中小企业的核心需求转向低成本、高效率的推理部署,能耗与成本成为最大瓶颈,Trainium 3精准切中这一市场痛点,实现性能与成本的双重颠覆。

相较上一代,Trainium 3原始性能提升4.4倍,性能功耗比提升4倍,整体能源效率提升40%,直接破解了大规模数据中心在能耗与成本上的难题。实测数据显示,部署主流开源模型(如 GPT-OSS)时,单芯片吞吐量提升3倍,响应延迟缩短4倍。

AWS表示,Trainium 3有望将AI模型全生命周期(训练+推理)成本整体降低50%,在当前算力市场极具竞争力。在英伟达GPU长期占据绝对主导、价格居高不下的背景下,Trainium 3为企业提供了真正可落地的性价比替代方案。

架构层面,Trainium 3单芯片提供2.52 PFLOPs(FP8)算力,支持FP32、BF16、MXFP8及新增MXFP4等多种精度格式。为解决大语言模型最突出的内存瓶颈,该芯片将HBM3e内存容量提升至144GB、带宽提升至4.9TB/s,同时强化结构化稀疏性和微缩放硬件支持,进一步优化大语言模型训练与推理效率。

得益于全新一代Neuron Fabric互联技术,单台Trn3 UltraServer可集成144张芯片,总算力达362 FP8 PFLOPs;通过EC2 UltraClusters 3.0架构,可扩展至最高100万张芯片的超级集群,规模较上一代提升10倍,已为Anthropic的“Project Rainier”项目提供核心算力支撑(目前已部署50万张Trainium 2,计划年底前扩容至100万张)。Karakuri、Metagenomi、NetoAI等客户反馈,使用 Trainium 3后训练与推理成本最高降低 50%,充分验证了其在真实生产环境中的成本优势。



AWS提前披露Trainium 4关键特性

更具深远影响的是,AWS提前披露了Trainium 4的关键特性:将原生支持英伟达NVLink Fusion高速互联技术,彻底打破云厂商自研芯片长期以来的“封闭生态”惯例,展现出“共存并竞争”的务实策略。目前全球约80%的AI应用基于英伟达CUDA生态开发,迁移成本极高。兼容NVLink Fusion后,企业可在同一集群内灵活混搭Trainium与英伟达GPU,按需分配任务(如训练用GPU、推理用Trainium),大幅降低迁移门槛。

Trainium 4预计FP8算力提升3倍、FP4算力提升6倍,内存带宽与容量分别提升4倍和2倍,并将与Graviton CPU、EFA网络及英伟达MGX机架深度融合。这一“以开放换市场”的举措,被业界视为 Trainium系列真正实现规模化普及的转折点。

02.基础设施延伸:AI工厂落地主权云,混合部署一举破解全球合规难题



随着AI深入政府、金融、医疗等高敏感行业,数据主权与合规性已成为全球性瓶颈。欧盟GDPR、美国国防与医疗安全审查等政策使得纯公有云难以满足要求。AWS此次推出AI工厂服务,将全栈AI能力从公有云完整延伸至客户本地或指定区域,快速构建功能等同于私有AWS区域的专属环境。

通过AI工厂,客户可实现数据本地化处理与存储,100%满足数据主权与行业合规要求,AWS负责基础设施全生命周期的部署、运维与升级,彻底解决传统私有云“部署难、维护贵”的问题。结合Trainium芯片、英伟达加速卡、高性能网络以及Bedrock、SageMaker等全套服务,AI工厂将私有云部署周期从数年缩短至数月。AWS同时宣布未来几年投资500亿美元建设美国政府专用高性能计算与AI数据中心,投入规模远超同行。

全球落地方面,AWS已同沙特Humain公司合作建设部署15万张AI芯片的“AI Zone”,基于GB300 GPU实现多吉瓦级扩展,服务智慧城市、医疗健康等领域;AWS欧洲主权云将正式上线,数据中心位于欧盟境内,由欧盟本地团队独立运营。客户可按需选择Trainium或英伟达最新Grace Blackwell、Vera Rubin平台,实现敏感任务本地化、非敏感任务公有云弹性扩展的最优平衡。

03.模型革新:Nova 2家族全面对标行业顶尖,Nova Forge开创“开放式深度定制”新范式

在模型层,AWS此前的表现相对低调,市场份额多被OpenAI、Anthropic等专业模型厂商占据。此次升级的Nova 2模型家族显然是AWS发力模型市场的关键举措,推出Lite、Pro、Sonic、Omni四款细分产品,全面覆盖推理、多模态、对话AI与代码生成等核心场景,直接对标行业头部模型。



Nova 2 Lite的基准测试数据

其中,Nova 2 Lite作为高性价比推理模型,支持文本、图像、视频等多格式输入,上下文窗口达100万token,性能对标Anthropic Claude 4.5 Haiku、OpenAI GPT-5 Mini等主流高效模型,主要面向中小企业的轻量化推理需求。



Nova 2 Pro的基准测试数据

Nova 2 Pro则瞄准复杂任务处理,推理能力媲美甚至超越OpenAI GPT-5、Google Gemini 3.0 Pro 等旗舰模型,特别适用于智能体相关任务。其强大的逻辑推理与工具调用能力,正是智能体完成复杂业务流程的核心,该模型目前已向Nova Forge早期客户开放预览。

Nova 2 Sonic专注于实时多语言对话场景,100万token的上下文窗口可容纳7.5万行代码或1500页文本,支持20余种语言的实时转译与对话,瞄准客服、跨境沟通等场景。

Nova 2 Omni作为全模态模型,能够同时处理图像、音频、视频和文本输入,并通过模拟推理生成多样化输出。例如,该模型可直接分析一段工业生产视频,识别设备故障并生成维修方案,为长文档、视频等复杂媒体处理提供一体化解决方案,填补了AWS在全模态领域的短板。



Nova Forge服务

AWS此次发布的Nova Forge服务颠覆了传统模型定制模式。传统模型定制多采用“微调”方式,在预训练完成的模型基础上,用企业数据进行二次训练。这种方式难以让企业专有知识深度融入模型底层,定制效果有限,且成本高昂。动辄数百万美元的定制费用让中小企业望而却步。

Nova Forge允许企业支付10万美元年费,不含工程师协助费用,在模型预训练、中期训练和后训练三个关键阶段接入Nova模型的检查点,将自有数据深度嵌入训练过程,打造具备专业领域知识的“定制模型”。这种模式大幅降低了深度定制的门槛,同时让模型更贴合企业业务逻辑。

实际应用中,Reddit利用该服务打造的“Reddit专家模型”,在平台敏感内容审核方面表现远超通用大语言模型。该模型能够精准识别Reddit社区特有的slang用语、梗文化相关的违规内容,误判率降低30%。生物技术公司Nimbus Therapeutics将药物研发数据嵌入Nova模型,构建的定制模型在分子结构预测、临床试验数据分析等任务中,效率较通用模型提升40%。Booking.com则通过定制模型优化酒店推荐算法,用户转化率提升15%。

相较于投入数亿美元从零构建模型,Nova Forge为企业提供了更经济高效的专业化路径,目前已支持Nova 2 Lite,并计划扩展至Pro和Omni模型。

04.应用落地:Bedrock AgentCore破解工程化难题,智能体加速企业部署



智能体AI虽被寄予厚望,但企业部署过程中面临的工程化难题不容忽视。安全合规风险、可靠性难以评估、长期记忆能力不足等问题,导致多数智能体仍停留在概念验证阶段,难以规模化落地。

AWS重点升级了 Amazon Bedrock AgentCore平台,针对企业部署中的核心需求提供一站式解决方案。该平台目前已全面通用可用,兼容CrewAI、LangGraph等开源框架及各类基础模型。这种开放性避免了企业被单一生态绑定,降低了开发成本。

在安全治理方面,AgentCore Policy功能允许开发者通过自然语言定义智能体的操作边界。例如“禁止访问财务部门数据库”“自动退款额度不得超过1000美元” 等,通过AgentCore Gateway实时拦截违规 API调用,实现独立于智能体代码的确定性控制。这一功能解决了智能体“越权操作”的风险,尤其适用于金融、医疗等监管严格的行业。该功能目前已进入预览阶段,AWS表示将后续支持更细粒度的权限管控,例如基于角色的访问控制(RBAC)与数据脱敏处理。

针对智能体可靠性难题,平台内置13种预置评估系统,覆盖准确性、安全性、工具选择逻辑、响应质量等关键维度,可对智能体进行持续监控。与传统人工评估不同,该系统通过大语言模型辅助生成评估报告,并解释失败原因。

例如,智能体未完成预订任务时,系统会自动分析是工具调用错误、参数设置不当还是上下文理解偏差,帮助开发者快速定位问题。这一能力大幅降低了企业自建评估体系的工程成本,据AWS客户反馈,采用AgentCore评估工具后,智能体从概念验证到生产部署的周期平均缩短60%。

记忆功能的升级让智能体具备了长期服务能力。AgentCore Memory可记录用户交互历史与偏好,支持多轮会话和跨任务场景的上下文连贯性。例如,用户此前告知智能体 “偏好无烟酒店”,后续预订时无需重复说明。新增的情景学习(Episodic Learning)功能,能让智能体从过往经验中持续优化决策质量。例如,在多次处理客户投诉后,智能体可自动总结最优解决方案。这些能力已在实际应用中展现价值。

PGA TOUR通过该平台构建的内容生成智能体,实现赛事新闻、球员数据报告的自动化生成,速度提升1000%,成本降低95%。Heroku基于平台构建的应用开发智能体,可协助开发者完成代码调试、部署流程自动化,开发效率提升30%。包括纳斯达克、百时美施贵宝等企业都已在借助该平台推动交易风控、药物研发等业务流程的自主化转型。

从底层Trainium芯片的算力突破,到AI工厂的混合云部署延伸,再到Nova系列模型的定制化能力,最终通过Bedrock AgentCore实现智能体工程化落地,AWS在re:Invent 2025上完整呈现了“芯片-模型-智能体-混合云” 的全栈战略布局。

这一架构并非孤立模块的简单叠加,而是通过各层级的深度协同形成合力。Trainium芯片为模型训练与智能体运行提供低成本算力支撑,AI工厂解决合规部署难题,Nova Forge让模型适配业务场景,Bedrock AgentCore降低智能体开发门槛。这种协同效应构建了强大的竞争壁垒,使其区别于仅专注于单一环节的厂商。

05.全栈协同构建竞争壁垒,AWS欲定义智能体AI的未来

在全球AI竞争进入深水区的当下,AWS的战略转型意义深远。硬件层通过能效革命与生态开放,在英伟达主导的市场中开辟出差异化路径。基础设施层以主权云解决方案,切入政府与受监管行业这一高价值市场;模型层用深度定制服务,满足企业“专业化”而非“通用化”的核心需求;应用层靠工程化工具,打通AI从技术到价值的转化通道。

这种全栈协同的竞争模式,不仅将重塑AI基础设施的市场榜局,还将推动企业智能化从单点应用走向全域自主化运营。未来,企业无需再整合多个厂商的产品,即可通过AWS生态快速构建贴合自身需求的智能体解决方案,这将大幅降低AI应用门槛,加速产业智能化进程。

当然,AWS的布局也面临挑战。

Trainium芯片的生态兼容性仍需时间验证,Nova模型的市场认可度需与OpenAI、Anthropic等厂商竞争,AI工厂的本地化部署能力还需应对不同地区的监管差异。

但不可否认的是,AWS此次发布的全栈战略,为行业提供了一种AI落地的全新范式。随着这一系列创新成果的落地,智能体AI有望真正突破技术瓶颈,成为驱动企业增长的核心引擎,开启人工智能商业化的全新阶段。


    24小时新闻排行榜更多>>
  1. DeepSeek放大招:追平谷歌,手撕GPT-5
  2. 跑3月外卖能买过万相机? 美团外卖美化宣传“毒鸡汤”
  3. 川普签法案 荣誉勋章年金提高逾三倍
  4. 华女痔疮手术后不堪剧痛自杀身亡
  5. 台海如何和平?前解放军上校称“解法其实很简单”
  6. 他让中国齿轮达到世界顶尖精度
  7. 传台积电董事长将赴南京出席活动 拜访大陆芯片公司
  8. 土耳其通报又有俄罗斯油轮在黑海遇袭
  9. 新国标电动自行车每辆4000元上下?网友:问就是为了你好
  10. 老祖宗的智慧:“两不说、三不问”
  11. 中国开展质疑冲绳归属舆论战
  12. 河南男子取百万现金 在银行门口遭抢劫受重伤
  13. 川普盟友任命案受挫 法院裁定她无资格任检察官
  14. 中国品牌扩张海外背后的竞争与焦虑
  15. 深圳开挖巨型垃圾填埋场
  16. 杨烁不顾央视警告,与刘涛传出绯闻
  17. 日本歌手上海无人演唱会令人震憾 胡锡进:中方损失大
  18. 习重提“自我革命” 遭遇官场集体软抵抗?
  19. 为何冬天时你应该在窗户边放一碗盐?
  20. 俄罗斯取代日本成为中国游客新宠?评论区亮了
  21. 华盛顿大学收5000万美元匿名捐款 免部分学费
  22. 纽约驾照新规通过,扣分将加重
  23. 台外长:新国际雁行联合舰队成形 拓展外交空间
  24. 宏福苑大火调查:港府称建筑外墙棚网不符合阻燃标准
  25. 中日关系紧张 高市拟与沙特在稀土领域合作
  26. 评论:九评21周年 全球4.55亿中国人“三退”
  27. “换皮”台湾护照套 中国网友自嘲是“外交后遗症受害者”
  28. 美国智库推演 日本卷入“台湾有事”最坏情况......
  29. 特立尼达和多巴哥证实美军在该国部署新雷达系统
  30. 萧美琴接受美媒专访 强调台湾正壮大实力
  31. 从王健林到钟睒睒,过去10年,哪个顶级富豪能一直赚钱?
  32. 北京出口管制加剧 欧企加速供应链去风险化
  33. 川普盟友任命案受挫
  34. 欧盟需要一个对美脱钩计划
  35. 富裕消费者推高买气,美国网络星期一消费料增6.3%
  36. 从香港到曼哈顿:瑞幸等中国品牌"重写街景"背后的竞争与焦虑
  37. 日企撤出中国! 中山Canon打印机厂停产 上千人失业
  38. 西安一楼盘交房仅4个月 房主开始降价卖房
  39. 梅拉尼娅公布白宫圣诞布置:“家之所在、心之所归”
  40. 试飞无人机仅半分钟 上海网民遭警方扣查
  41. 委内瑞拉已批准来自美国的移民遣返航班降落
  42. 我的文革:抄家的经过
  43. 恢复高考的具体过程与历史功绩
  44. 卢比奥抢回谈判主导权 与乌克兰重写和平计划
  45. TSA宣布明年2月起无REAL ID旅客将收45美元费用
  46. 东京飞上海航班紧急返航 发生妨碍安全非法行为
  47. 亚马逊最新AI芯片,挑战英伟达和谷歌
  48. 华尔街日报社论:中国霸凌日本给世界上了一课
  49. 强力球头奖攀升至$7.75亿
  50. 实测豆包手机助手:喂了苹果画了两年的饼
  51. 中配钱丽宣扬武统遭废依亲居留 华硕回应了
  52. 马斯克:10年后人类工作将成可选项,每个人都"足够富足"
  53. 欧美两个内衣品牌接连撤离中国市场
  54. 美校报调查:中共利用美实验室研发核武
  55. 韩电商巨头数千万用户信息遭泄 中国籍雇员或已离境
  56. 马克龙访华:他不能再像2023年那样冒险
  57. 纪录片《AI向新力》12月3日上线
  58. 当自由派忽视“国族认同”:极右势力为何席卷欧美?
  59. 筑地餐厅因中国客减少降价?日查核打脸谣言
  60. 叶剑英七位遗孀,无一人参加他的葬礼