何恺明de三位本科生:突破效率瓶颈

2025-12-15 19:25:24 · chineseheadlinenews.com · 来源: 量子位

何恺明团队新作,持续聚焦Flow模型。

与MeanFlow对流匹配的优化不同,这次主要旨在解决归一化流在生成模型中的局限。

论文提出名为双向归一化流(BiFlow)的新框架,通过解耦前向过程——将数据映射为噪声,和逆向过程——把噪声再转回来生成图片,成功打破了传统归一化流生成模型效率低下的问题。

值得一提的是,论文的三位一作分别是来自清华姚班和MIT的本科生。

BiFlow:逆向过程不必是前向过程的精确逆运算

归一化流方法(NFs)已经成为生成建模的一种原则性框架。

标准的归一化流包含前向过程和逆向过程:

前向过程将数据映射为噪声,逆向过程则通过对前向过程求逆来生成样本。

传统的NF模型有一个硬性规定,逆向过程必须是前向过程的精确逆运算——要像钥匙和锁一样完全匹配。这就导致了两个问题:

模型设计受限:因为要保证 “可逆”,不能使用很多强大的通用架构(比如视觉Transformer),得特意设计复杂结构;

推理速度慢:由于架构约束,归一化流通常需要比其他模型更深、更宽的网络才能达到相似效果。以TARFlow为例,逆向生成时需要一步步按顺序计算,并且无法并行加速。

BiFlow的核心创新就在于,打破了“逆向过程必须是前向过程的精确逆运算”这一规则。

设计思路是这样的:

BiFLow解耦了前向过程和逆向过程的设计。

前向模型仍然使用易于训练的流模型(如改进版TARFlow),将数据映射为噪声。

逆向模型则引入一个可学习的独立模型,来近似前向模型的逆映射。

由此,逆向模型不需要是前向模型的数学精确逆,可以使用任意架构(如非因果的双向Transformer)来实现并行化和高效计算。

逆向模型也可以在单次前向传递中,直接从噪声生成图像,无需像自回归模型那样逐步生成。

具体来说,何恺明团队的这篇新论文提出了三项关键技术。

隐藏层对齐(Hidden Alignment)

为了解决独立逆向模型容易跑偏的问题,论文提出了一种新的损失函数策略,既利用了全轨迹监督,又保持了架构的灵活性:

利用前向过程的完整中间状态轨迹(数据→半噪声→纯噪声)作为监督信号;

通过可学习的投影头,将逆向模型的中间状态与前向状态对齐。

学习去噪(Learned Denoising)

传统NF方法(如TARFlow)推理时需要额外去噪,会增加计算量。

BiFlow将去噪步骤直接整合进逆向模型的一个额外模块中,实现了“端到端”的从噪声到清晰数据的映射,消除了额外的推理开销。

训练时无分类器引导(Training-time CFG)

为了在推理时保持单步生成(1-NFE)的高效性,BiFlow在训练阶段就引入了无分类器引导(CFG),让模型学习以CFG比例为条件的生成,从而避免了推理时计算两次前向传播的成本。

实验结果:速度提升两个数量级

实验结果显示,在生成质量方面,BiFlow在ImageNet 256×256数据集上,取得了2.39的FID分数,刷新目前基于NF方法的SOTA。

在推理速度方面,相比于基线方法(改进版TARFlow),BiFlow的采样速度提升了两个数量级(在TPU上快697倍)。

另外,BiFlow凭借双向映射特性,无需额外训练即可实现图像修复和类别编辑两类图像编辑任务。

本科生领衔

BiFlow有两位项目负责人。

陆伊炀,江苏南通人,清华姚班大二本科生,目前在MIT计算机科学与人工智能实验室(CSAIL)实习,导师是何恺明,主要研究方向为计算机视觉和深度生成模型。

高中时期,他是物理竞赛生,曾以江苏选手中第一名、全国第九名的成绩,在2022年获得了第三十九届全国中学生物理竞赛(CPhO)金牌。

Qiao Sun,MIT大二本科生,目前是何恺明计算机视觉课题组的本科生研究机会项目(UROP)学生。研究主要集中在生成模型方面,如扩散模型、流匹配等。

Qiao Sun高中毕业于上海中学,是2023年国际数学奥林匹克竞赛(IMO)金牌得主。

论文的另一位一作是王衔邦,今年刚从人大附中毕业,进入MIT学习。他的导师同样是何恺明。

王衔邦还是一名双料竞赛生,在2024年IMO上摘得金牌,还在2021年和2022年获得过全国信息学奥林匹克竞赛的银牌。


    24小时新闻排行榜更多>>
  1. 《清朝条约全集》遭全网下架 引关注
  2. 最高年薪$20万 川普启动“美国科技部队”
  3. 叙利亚变天一年后 阿萨德要重操旧业 当眼科医生
  4. 【军事情报局】中日擦枪走火?歼-15与F-15的真实差距
  5. 传下月开“五中全会” 胡春华与张升民入政治局、马兴瑞被官宣
  6. 【军事情报局】柬军机枪打F-16 泰柬战场失衡解析
  7. 历史47次验证 2026与2027赤马红羊年必有翻天巨变
  8. 昂山素季遭关3年失联
  9. 印度人,操控了西方互联网
  10. 五角大楼秘件:若美国军事干预台海 恐将遭遇失败
  11. 张德培家族创业神话破灭 负债千万 在美国申请破产
  12. 中国走线人的自由与幻梦
  13. 黎智英的一生:他如何成为了中共的“眼中钉”?
  14. 这个原产美国的物种,正疯狂侵占中国的农田
  15. 这本早年书籍突遭全面下架
  16. 前所未见的海底结构 科学家重新审视百慕大
  17. 不入北约非妥协,泽连斯基学会“交易的艺术”
  18. 中国运动员王莉称基地主任索要奖金并打压她
  19. 中国富豪谋求在美代孕生娃 目标是上百个
  20. 美国“绿卡”变“金卡” 明码标价的“精英通道”
  21. 川普:“伊斯兰国”组织将遭受“重创”
  22. 习罕见曝党内急躁冒进 分析:经济问题倒逼
  23. 美启动“科技部队”计划 招专家研发AI等
  24. 川普:南加美墨边境新增“军事化管控区”
  25. 第一批免签去俄罗斯的中国人为何傻眼了?
  26. “大英”,是怎么把自己的汽车产业折腾没的
  27. 与医生和医院有关的笑话 让你一笑治百病
  28. 误将亡者大脑给家属,加州殡仪馆挨告
  29. 【新闻大家谈】美情报局将曝光中共高层财富?
  30. ICE突袭执法接连爆发枪击
  31. 美媒:库什纳身处川普腐败网络的中心
  32. 暴跌70% 扫地机器人鼻祖宣布破产 中国债主或接盘
  33. 昂山素季遭关3年失联!儿忧:可能已经去世了
  34. 警惕美国的“双赤字”
  35. 美军再出手!空袭“3艘贩毒船”酿8死
  36. 美国布朗大学枪击案缉凶仍在继续,一男子被拘后获释
  37. 【重播】卢比奥与巴拉圭外长签署美-巴驻军协议
  38. 黎智英案 香港民主人士旁听:希望黎早日获释
  39. 压倒优势 极右翼候选人当选总统 “父亲曾是纳粹”
  40. 为戒严,尹锡悦金建希激烈争吵
  41. 著名导演夫妇遇害 川普冷血发声引发巨大争议
  42. 杭州小米交付中心出意外 目击者:倒车突加速
  43. 暴跌68%!习近平正悄悄从《新闻联播》消失
  44. 这一年太累了?这10部电影能慢慢把你治好
  45. 布朗大学枪案:嫌疑人获释,枪手在逃
  46. 李国庆宣布“60岁再创业”
  47. OpenAI再度“挖墙角”,从谷歌挖来Albert执掌公司发展
  48. 年终报道:中国经济萧条的背后
  49. 女护士为了马拉松梦,必须放弃工作?
  50. 旧金山湾区迎最干旱开局
  51. 佛州推进取消“强制”学龄儿童接种疫苗
  52. OpenAI首曝Sora内幕:85%代码竟由AI完成
  53. 陕西女教师微信群说希望学生“全都甲流” 引众怒
  54. 湖北孝感一企业拖欠农户粮食款超10年,超千万
  55. 一名股票分析师的见证:中国A股如何崩坏
  56. 分析:中共AI战略在A股市场是一场骗局
  57. 黎智英被定3罪 川普出手了“我们拭目以待”
  58. 上海失控!房价狂跌50%!1/4家庭破产!
  59. 机场健身潮来袭,旅客怒了
  60. 无法无天大乱大“治” 怀念文革各取所需