清华新框架让:12倍端到端加速,基准评分翻倍

2026-02-14 15:25:20 · chineseheadlinenews.com · 来源: 量子位

让大模型像人类一样阅读!通过精读略读实现性能与效率的双重飞跃。

在长上下文场景中,Transformer架构的二次计算复杂度让推理速度急剧下降,而人类面对长文档时却能游刃有余——我们不会逐字阅读整本小说,而是对关键情节精读,对背景描述略读。

来自清华大学、鹏城实验室与阿里巴巴未来生活实验室的联合研究团队发现:现有任务相关的压缩方法不仅陷入效率瓶颈——要么一次性加载全文(效率低),要么自回归逐步压缩(速度慢),更难以兼顾“保留关键信息”与“保持自然语言可解释性”。

受人类阅读认知启发,他们提出全新框架RAM(Read As HuMan),首次将“精读+略读”的混合策略引入上下文压缩,不仅在多个长文本基准上取得卓越表现,更在平均1.6万token的输入上实现12倍端到端加速。

像人类一样阅读:精读重要内容,略读背景内容

研究团队从认知科学中汲取灵感:人类阅读时会动态分配注意力——对与目标高度相关的内容进行精读(close reading),保留全部语义细节;对次要背景信息采用略读(skimming),快速提取核心语义。

RAM将这一行为转化为可计算的自适应压缩策略:

精读区:高相关片段完整保留原始文本,确保关键信息零损失,维持自然语言可解释性

略读区:低相关片段通过查询引导压缩为单个语义向量,极致削减冗余内容

混合表示:精读文本与略读向量按原顺序拼接,形成“显式+隐式”混合上下文,既保留关键细节又大幅缩短长度

更关键的是,RAM突破了现有方法的效率瓶颈:所有片段与查询并行编码,彻底规避了全文一次性加载的二次复杂度,也摆脱了自回归压缩的串行等待,真正实现“压缩即推理”的高效流水线。

授人以渔:让模型学会“何时精读、何时略读”

仅有策略不够,如何让模型精准判断“哪些内容值得精读”?RAM引入对比学习优化决策边界:

利用正负样本对(含答案片段/无关片段)训练查询-片段相关性判别器

通查询引导的注意力计算计算片段重要性,动态决定段落的保留(精读)和压缩(略读)

略读过程采用查询引导加权平均:对每个token计算与查询的相似度,聚焦提取与任务相关的语义“精华”

这种设计使RAM在训练阶段仅需单次训练,即可泛化至多种任务(问答、摘要)与任意压缩比例(2x–32x)。更令人惊喜的是,尽管训练时最大长度仅2万token,RAM在3.2万tokens的NarrativeQA测试中性能反超未压缩原文,展现出强大的长度外推能力——它学会的不是记忆固定模式,而是组合式语义表征。

实践出真知:效率与性能的双重飞跃

多种任务上表现出色

在NaturalQuestions、HotpotQA等四大问答基准与MultiNews摘要任务上,RAM以LLaMA-3.1-8B和Qwen3-4B为基座,在4x/8x压缩下均展现出优越性能。以Qwen3-4B为例,4x压缩时EM分数达66.59(输入原文时32.77),证明压缩非但未损伤性能,反而通过去噪提升了推理质量。

12倍加速,长文秒级响应

在平均1.6万token、最长3.2万token设置的NarrativeQA数据集上,RAM端到端延迟仅0.20秒(32x压缩),相比于输入原始提示词(端到端时延1.23秒)——提速约6倍。压缩阶段耗时仅0.08秒,真正实现“压缩成本可忽略”。

压缩鲁棒性:从2x到32x稳如磐石

当压缩率从2x提升至32x,RAM的EM分数仍稳定高于基线。这证明RAM在各种压缩率下的表现具有鲁棒性,从2倍压缩率到32倍压缩率稳如磐石。

总结

RAM的工作为长上下文LLM部署提供了新范式:它不再将压缩视为“不得已的妥协”,而是通过模拟人类认知策略,将效率与性能转化为协同增益。

方法论创新:首次将“精读+略读”混合策略算法化,打破效率-保真度权衡

工程突破:并行化设计使压缩成本趋近于零,真正满足工业级实时需求

认知启示:证明借鉴人类信息处理机制,可为AI系统设计提供强大灵感

当大模型学会像人类一样“有重点地阅读”,长文本不再是负担,而是可高效驾驭的知识海洋。RAM不仅压缩了上下文长度,更压缩了AI与人类认知之间的距离。


    24小时新闻排行榜更多>>
  1. 2026大龄剩女天塌了!50女抢1男
  2. 泰总理结婚,夫人来自华裔家庭
  3. 四名土耳其女网红被通缉,“发布了不堪入目的内容”
  4. 祸起清零政策 青海男遭警群殴案再引关注
  5. 为何美国这家快餐厅要移除所有微波炉
  6. 中国游客在韩入住10米超长大床房
  7. 黄仁勋跌出全球十大富翁
  8. 川普宣布《海洋行动计划》 重振造船业
  9. 李在明遇刺案幕后人曝光,幕后藏镜人居然是他!
  10. 驳《2026年,我眼中的中国经济》,只是愿望,远非现实
  11. 74岁宋春丽近况曝光
  12. “港女北嫁”数据攀升,什么在影响香港女性的选择?
  13. 日本水产厅释放遭逮捕的中国船长
  14. 生物学博士橙县演讲:进化论如何渗透社会
  15. 收手吧周星驰
  16. 加价近100%也约不上!节前这个行业彻底“爆单”了
  17. 凭37年前一枚模糊指纹,香港前TVB女主播破获悬案
  18. 俄情报局中将被曝遭枪击时绝地反击,细节披露
  19. 惊爆高金素梅见胡锦涛后 国台办转交近亿元?张俊杰负责发钱
  20. 澳洲$7.86亿大桥通车前夕惊现巨大裂缝
  21. 震撼!CIA居然发布新视频招募中国军方线人
  22. 从地方选举到社群渗透:孙耀宁案的七大关键
  23. 王小洪“中弹了?” 张又侠、刘振立翻盘依然有望
  24. 邬凯宁——从“新闻女王”到“罪犯克星”
  25. 重庆新婚夫妇蜜月旅行去乌克兰做公益 网评翻车
  26. 黄金回收,小心这些套路
  27. 职高小伙用AI做120多个App
  28. 赫尔佐格回击川普:狙桃所知,我才是以色列的总统
  29. 王毅:川普非常尊重中方,但还有人想打压中国
  30. 美国官方“开盒”:反对我的统统查社媒信息
  31. 租屋族饮水过滤设备怎么选?
  32. 消息:美军正为可能持续数周伊朗行动做准备
  33. 中共两会将至 大批截访者在国家信访局排队占位
  34. 节前这个行业彻底“爆单”了
  35. 美媒爆料:美对委军事行动中使用了AI模型
  36. 上海闹市惊现“天坑” 全世界看穿“基建狂魔”世纪骗局
  37. 张升民“慰问”北京卫戍区爆 军队传“除夕除习”
  38. 王毅慕尼黑见被中共更名的“鲁比奥” 引讥讽
  39. 蚂蚁开源Ring-2.5-1T:IMO金牌水平
  40. 公募高管批量“上下课”
  41. 两场战役成真 她预言下雨与胜利的那一夜
  42. 浙江表彰有突出贡献中青年专家
  43. 情人节听高僧说:情人到底是你的谁?
  44. 宣布加征关税一年后,美国赢了吗?
  45. 美军再打击加勒比海运毒船 击毙3名贩毒分子
  46. 毛阿敏现身企业年会,再唱经典
  47. 他们致力于让独立出版的海内外华语书籍被看见
  48. 俄乌下一轮会谈前 白宫发出罕见催促
  49. 全球最强护照排行榜 台湾32名中国56名
  50. 超越π*0.6:具身智能奇点已至
  51. 涉嫌为妓院拉客,2华男落网
  52. 医疗事故求偿1800万,法院判赔一半
  53. 多名挪威政要牵涉爱泼斯坦案,挪威首相:一查到底
  54. 王小洪“政治患癌”?传曾跨国镇压美华裔奥运冠军
  55. 岳云鹏蔡文静上热搜:两人居然演夫妻
  56. 鲁比奥在慕尼黑发表演讲
  57. 韩国舞团抄袭《只此青绿》获大奖
  58. 经历多年边境危机 德州小镇回归昔日宁静
  59. 夫妇汽车被盗,反收到2.8万元的罚单
  60. 字节跳动Seedance 2.0引发好莱坞集体抵制,原因是...