RISC之父David Patterson:AI推理需要另一种硬件

2026-03-14 02:25:42 · chineseheadlinenews.com · 来源: DeepTech深科技

近日,2017 年图灵奖得主、被称为“RISC 之父”的 David Patterson 最近与 Google DeepMind 高级工程师马晓宇在 IEEE Computer 联合发表了一篇论文——“关于大语言模型推理硬件的挑战与研究方向”,引发了科技圈的关注与讨论。

(来源:arXiv)

David Patterson,这位 RISC 架构的奠基人、影响了全球 99% 微处理器设计的计算机科学家,在论文开篇就抛出了一个尖锐的判断:

当前 AI 芯片的设计思路,即满载的算力、堆叠的 HBM(High Bandwidth Memory,高带宽内存)、带宽优先的互联,与大语言模型推理的实际需求严重错配。

(来源:UC Berkeley)

(来源:四家公司财报数据)

面对这些挑战,论文将问题归结为两堵“墙”:内存墙与延迟墙。

内存墙的本质是硬件发展的不均衡。Patterson 引用了一组数据:从 2012 年到 2022 年,NVIDIA GPU 的 64 位浮点运算能力提升了 80 倍,但内存带宽只增长了 17 倍。这个差距还在持续扩大。

更麻烦的是,HBM 的成本不降反升。论文援引花旗银行的研究数据指出,从 2023 年到 2025 年,HBM 的单位容量成本(/GB)和单位带宽成本(/GBps)都上涨了约 35%。这与传统 DDR DRAM 形成了鲜明对比,后者的成本在同期下降了近一半。

图 | HBM(上)和 DDR(下)的单位容量成本和单位带宽成本随时间变化的趋势线(来源:论文)

造成这种分化的原因在于制造工艺:HBM 需要堆叠多层 DRAM die,封装难度随着堆叠层数和密度的增加而上升,良率问题愈发严峻。

图 | (a) 高带宽内存 HBM 封装俯视图,(b) HBM 侧视图(来源:论文)

过去,数据中心的推理通常在单芯片上完成,只有训练需要超级计算机级别的集群。因此,连接这些芯片的互联网络主要优化带宽而非延迟。但 LLM 改变了游戏规则:模型太大,推理也需要多芯片系统;软件层面的分片(sharding)意味着频繁通信;而 Decode 阶段的小 batch size 导致网络消息往往很小。对于这种“频繁、小消息、大网络”的场景,延迟比带宽更重要。

这个方向有两种实现路径:一种是在 HBM 的 base die 上集成计算逻辑,复用现有 HBM 设计,带宽与 HBM 相当但功耗降低 2 到 3 倍;另一种是定制化 3D 方案,通过更宽更密的接口和更先进的封装技术,实现超越 HBM 的带宽和效率。挑战在于散热:3D 结构的表面积更小,散热更难,以及需要建立内存-逻辑接口的行业标准。

第四个方向是低延迟互联。

论文建议重新审视网络设计中延迟与带宽的权衡。具体措施包括:采用高连接性拓扑(如树形、蜻蜓、高维 Torus),减少跳数从而降低延迟;引入网络内处理(Processing-in-Network),让 LLM 常用的通信原语(如 all-reduce、MoE 的 dispatch 和 collect)在交换机中加速;优化芯片设计,让小包数据直接存入片上 SRAM 而非外部 DRAM,或将计算引擎靠近网络接口以缩短传输时间;甚至在可靠性设计上做文章,部署本地备用节点减少故障迁移的延迟和吞吐影响,或者在 LLM 推理对完美通信要求不高时,用假数据或历史结果替代超时消息,而非等待掉队者。

Patterson 在论文中还不忘强调个人观点:他批评了当前学术界与产业界的脱节。

1976 年他入行时,计算机架构会议上约 40% 的论文来自工业界,而到 2025 年的 ISCA(International Symposium on Computer Architecture),这个比例已经跌破 4%。

他呼吁学术研究者把握 LLM 推理这个"诱人的研究目标",并建议开发基于 Roofline 模型的性能模拟器,配合现代的性能/成本指标(如 TCO、功耗、碳排放),为 AI 推理硬件创新提供更实用的评估框架。

当前,全球正经历一场因 AI 引发的内存供应危机。由于 HBM 生产挤占了传统 DRAM 的晶圆产能,2026 年全球 DRAM 价格大幅上涨。三星、SK Hynix 等厂商正将更多资源转向高利润的 HBM 产品线,这虽然满足了 AI 数据中心的需求,却加剧了消费级内存的短缺。这种供应紧张可能持续到 2027 年甚至更久。

在这种背景下,Patterson 提出的 HBF、PNM 等替代路径,或许不仅是技术上的探索,也是产业寻找 Plan B 的现实需求。

当然,论文也承认这些方向并非可以一蹴而就的方案。每一个都涉及复杂的工程权衡:HBF 需要解决软件如何处理有限写入耐久性和高延迟读取的问题;PNM 和 3D 堆叠需要新的软件分片策略和内存-逻辑接口标准;低延迟互联可能需要牺牲部分带宽。

论文鼓励将这些方向组合使用,因为它们在很大程度上是互补的。更高的内存带宽可以缩短每次 Decode 迭代的延迟,更大的单节点内存容量可以减少系统规模从而降低通信开销。

作为 RISC 架构的共同发明人、RAID 存储系统的开创者,Patterson 的职业生涯几乎就是"挑战现有范式"的代名词。40 多年前,他和 John Hennessy 提出的精简指令集思想曾被工业界视为异端,如今 99% 的新芯片都采用 RISC 架构。

Patterson 和马晓宇选择发表这篇论文的方式也很有意思,它不是一篇技术细节密集的顶会论文,而是发在 IEEE Computer 这本面向更广泛读者的杂志上,语气像是在发布一封公开信。值得注意的是,他们在致谢中提到了 Martin Abadi、Jeff Dean、Norm Jouppi、Amin Vahdat 和 Cliff Young,这串名字几乎覆盖了 Google AI 基础设施的核心架构师。


    24小时新闻排行榜更多>>
  1. 伊朗战争:目前的停火形同美国遭遇了战略溃败
  2. 以黎拟启动谈判,黄金美股急涨原油跳水
  3. 达赖深度卷入爱泼斯坦权色网,印媒再爆惊人新证据
  4. 中国未来超过一半人口,将会流入到这些地方
  5. 委内瑞拉示威民众与警方爆发冲突
  6. 伊朗外交关系战略委员会主席死了,还能谈吗?
  7. 【翻墙必看】河南“科幻级”数据造假
  8. 三大分歧仍在,美伊谈判“面临风险”
  9. 伊朗每天限15艘船通过霍尔木兹海峡
  10. 迟重瑞娶陈丽华,付出3大牺牲换一生陪伴
  11. 红帽中国研发团队全裁
  12. 涉及爱泼斯坦,梅拉尼娅的罕见讲话都说了什么?
  13. 网传海南男孩驾奔驰一路乱撞 造成至少3亡
  14. 富士山下樱花盛开 过度旅游再困扰日本小镇
  15. 岳云鹏瘦8斤,脸小一圈差点认不出
  16. 伊朗新领袖强硬声明,誓言“为父复仇”
  17. 在南京向郑丽文喊话者被捕 王丹析内情
  18. 美伊谈判在即,酒店附近军警荷枪实弹
  19. 万斯4.11与伊朗会谈 川普称对协议“非常乐观”
  20. 火遍全网!“SBTI”人格测试结果出来后,我人麻了
  21. 郑习会来了,绿营要大追杀?
  22. 梅拉尼娅罕见就爱泼斯坦案发声
  23. 分析:中共为何急切介入美伊停火
  24. 川普准备惩罚盟友,初步计划曝光
  25. 当“进口”变成可以购买的信号,真相就是稀缺品
  26. 万米高空舱门开了,机上乘客竟微笑面对
  27. 梅拉尼娅否认认识爱波斯坦
  28. 全女电影拿下票房冠军,观众怎么边哭边骂?
  29. 放弃“蓝帽子”绕道海外:国内保健品为何爱变“洋牌子”?
  30. IMF将下修成长预测
  31. 脑机接口术后5年了,他感觉怎么样?
  32. 美国无所不能神话破灭?脆弱的停火协议削弱公信力
  33. 北约会成为伊朗战争的另一个牺牲品吗?
  34. 我们和王朔聊了聊猫,生死和AI
  35. 停火背后,美国真正的死穴在“这里”...?
  36. 美智库:伊朗战争 中共助伊朗重建导弹计划
  37. 华人外卖平台暴雷,竟有这么多“隐性收费”
  38. 墨西哥奥尔梅卡炼油厂再起火 尚无伤亡报告
  39. 专家:中共设40天禁航区多重动机 国际须警惕
  40. 以色列“不讲武德”,美伊谈判还有戏吗
  41. 驾驶是一种特权,而非一项权利
  42. 中国维权企业家沈启家因“翻墙”遭罚
  43. 大陆“拼豆”玩具藏隐患 贵州女孩触电离世
  44. 他35岁成上海首富,如今公司巨亏234亿!
  45. 我国科学家揭示黄石超级火山形成机制
  46. 拜登儿子深陷1亿债务,还公开向川普儿子发起挑战
  47. 虚假摆拍“深山救助流浪女”,3人被查
  48. 用Skill炼化员工,这个春天最荒诞的技术神话
  49. 对《我,许可》中失真的女工戏剧工作坊与演出的反思
  50. 纽约幼童免费托育 推“朝八晚六”全年托育制
  51. 黎巴嫩流离失所者:受够了战争
  52. “不知不觉变富了”?美国阶层大洗牌 上层中产激增
  53. Artemis II绕月后返航 周五溅落圣地亚哥外海
  54. 法拉盛四死火灾纵火嫌犯过堂 检方:随机作案
  55. 安置游民 加州今年再投资5.6亿美元
  56. 被16所名校拒收,男孩转身进Google
  57. 中东产油国要求亚洲提交原油装载计划
  58. 班森贺86街游民所工地因石棉问题被叫停
  59. 川普经济国师可能换上这个人
  60. 美伊停火协议后,霍尔木兹海峡航运为何仍未恢复?