谷歌推出文本“扩散模型”Gemini Diffusion

2025-05-21 07:25:13 · chineseheadlinenews.com · 来源: 量子位

谷歌又放新大招了,将图像生成常用的“扩散技术”引入语言模型,12秒能生成1万tokens。

什么概念?不仅比Gemini 2.0 Flash-Lite更快。

甚至需要不得不在演示过程中放慢视频的速度,才能看清生成过程。

这是Google DeepMind推出Gemini Diffusion:不同于以往大多数语言模型“从左到右”预测文本的生成方式,而是通过逐步优化噪声来学习生成输出。

传统的自回归模型是根据已生成的词序列逐步预测下一个词,每次只能生成一个词或一个token,这种顺序过程很慢,并且会限制输出的质量和一致性。

而扩散模型的特点则是通过逐步细化噪声学习生成,这种特点会大大提高生成速度,并且减少训练的不确定性。

Gemini Diffusion就是利用了扩散模型这一优势,将文本生成速度提升至2000token/秒。

官方给出了Gemini Diffusion的基准测试结果,结果显示Gemini Diffusion的表现可与更大的模型(Gemini 2.0 Flash-Lite)相媲美,甚至速度更快。

Gemini Diffusion目前是一个实验性演示,官方设置了访问候补名单,感兴趣的朋友可以申请体验~

Gemini Diffusion每秒能生成2000个token

消除“从左到右”文本生成需求

与以往大多数基于自回归的语言模型不同,Gemini Diffusion在语言模型中引入了“扩散”技术,它不是直接预测文本,而是通过逐步细化噪声来学习生成输出。

这种技术能够让模型在生成过程中快速迭代,并在生成过程中进行错误纠正。

这种优势有助于模型在编辑等任务中表现出色,包括在数学和代码环境中也能表现良好。

有一位团队研究员展示了一个代码示例,在这个示例中,Gemini Diffusion模型以2000 个token/秒的速度生成,这其中包括toke化、预填充、安全过滤器等开销。

在生成过程中进行非因果推理

虽然Gemini Diffusion在生成速度上比迄今为止最快的模型还要快得多,但速度却不是它的唯一优势。

它能够一次生成整个标记块,这意味着对于用户的提示,它能比自回归模型做出更连贯的响应。

在迭代细化中能够纠正生成过程中的错误以获得更一致的输出。

研究员还通过举例说明,与仅限于一次生成一个token的自回归模型不同,扩散可以在生成过程中进行非因果推理。

“(√(81) * (2/3))^2 + (15 - 3) / (2^2)) 等于多少?先给出答案,然后再推导出答案。”

对于基于自回归思想的模型来说,这是一个非常难的问题,例如,GPT-4o就无法解决此问题,因为它们必须严格自回归生成文本,无法跳过中间token,在生成答案之前对其进行推理。

但扩散模型的生成过程不依赖于严格的时序因果关系,而是通过并行或迭代式去噪实现数据生成,可以进行非因果推理以得出正确答案(答案:39)

One More Thing

实际上,自回归确实不是LLM的唯一路径。

此前,人大高瓴人工智能研究院、蚂蚁也提出了类似研究,LLaDA是基于扩散模型的双向模型。

语言模型逐步引入扩散技术,在未来,我们是否可以期待更多混合模型的出现呢?


    24小时新闻排行榜更多>>
  1. 金正恩暴怒 驱逐舰下水船底破洞令朝鲜颜面尽失
  2. 八九年的一个错觉——李鹏政治智商析疑
  3. 诺奖得主:芬太尼危机在美泛滥,为何欧洲没有?
  4. 怕被ICE抓,哈佛毕业生自行驱逐
  5. 非营利组织员工涉收回扣操控游民所经费 
  6. 马斯克重返白宫见南非总统,眼神引热议
  7. 震惊!移民法庭当庭吊销身份 ICE探员现场抓人…
  8. 美退出世卫组织 中国宣布提供5亿美元 成最大金主
  9. 为何科学家警告禽流感可能成为下一场全球大流行病?
  10. 全美最佳居住地250强出炉
  11. 沃尔玛宣布裁员1500人 简化架构提升效率
  12. 纽约市投资4亿元重塑第五大道 2028年动工
  13. 央视美女主播念错稿 网友笑喊“姐姐撑住”(图/视频)
  14. 蓝天立案引发广西官场大清洗 传牵出郭声琨
  15. 忧虑还是自豪?一个属于中国的世纪可能已经到来
  16. 金穹有何威力 中共为啥紧张 一文看懂
  17. 美联邦法官驳回对纽瓦克市长非法侵入的指控
  18. 川普“美丽大法案”:更低效、更不公平
  19. 金正恩见证下水事故 驱逐舰翻覆破裂搁浅
  20. 弗州议员吁制止中共迫害法轮功 美国务院回应
  21. 【内幕】从政审到监控 中共对留学生设枷锁
  22. 川普晤南非总统 突播视频指南非白人遭“种族灭绝”
  23. 1998年的“镜像版本”,这一次“亚洲不要美元”了?
  24. 第38集团军军长六四抗命 一句话撼动军队
  25. CNN:美国接获情资 以色列正准备攻击伊朗核设施
  26. 纽约时报:推翻专制统治者的三种武器
  27. 医生公开朱媛媛住院照,临终前只能吃流食
  28. 传员工讨薪不果伤人纵火 四川纺织厂仓库被烧
  29. 川普的“美丽大法案” 实际上更低效 更不公平 美国更承受不起
  30. 中共国家一级演员陈丽云被逮捕
  31. 地道现绝密文件:是谁出卖巴勒斯坦?
  32. 危机四伏的社会?当她们被70岁以上老人猥亵后
  33. 中国经济如漏油卡车 专家揭4月数据背后危机
  34. 文昭:从香港国安新政看港台民主法治的未来
  35. “AI重塑搜索”已成型,货币化也已考虑
  36. 杭州积极筹办钱塘大学
  37. 五角大楼正式接收卡塔尔赠机 拟作新“空军一号”
  38. 中国亮出“九天”空中母舰 竞争美国“死神”无人机的杀招?
  39. 二百多军官被毙、撤职、处分——长津湖战役中的自88师
  40. 吴宗宪力挺汪小菲,炮轰大小S是坏蛋
  41. 试谈美国的债务问题及其深层因素
  42. 蔡奇之子升迁消息被披露 疑涉中共高层内斗
  43. 小鲜肉被大38岁女星包养13年
  44. 知名导演突发疾病,不幸逝世
  45. 衡山新发现8株野外绒毛皂荚新生幼苗
  46. 德经济界吁政策转向:重新思考市场经济模式
  47. 中国亮出“九天”空中母舰
  48. 央视主播胡蝶口误"两国"遭起底 丈夫陆川是秦岚旧爱
  49. 习以《推背图》制作“涉谶”名单?习洛阳行预示大凶
  50. 我们扒光了36段“非正常关系”
  51. Google大会一文读懂:用AI革自己的命
  52. 人到中年,还能否大大方方使用可爱的东西?
  53. 美国新版星球大战计划来了
  54. 美国12个州联合向联邦法院提告川普
  55. 网红国字脸猴“大壮”死亡 园方:突发病 全力抢救无效
  56. 美国警告使用华为芯片 北京称“霸凌”
  57. 酒过三巡 菜过五味“三巡”和“五味”是什么?
  58. 东方寿带鸟育雏画面
  59. 让阳光照入权力的钱袋子,才是避免“百万耳环”的根本
  60. 美试射具核能力导弹 展现三位一体 威慑中俄