共识机制,自我进化:微调已死

2025-10-28 04:25:20 · chineseheadlinenews.com · 来源: 量子位

当前,人工智能领域正经历一场由“模型微调”向“上下文工程”的范式转变。

通过在输入中引入更明确的指令和更丰富详实的知识,“上下文工程”既无需投入高昂的训练成本,亦不依赖开源模型权重参数,同时能够为用户和开发者提供更强的可解释性,正逐渐成为构建高性能、可扩展且具备自我改进能力的 AI 系统的核心范式。

正因如此,“微调已死”成为了AI领域近期广泛认可的热门话题。

斯坦福新论文:微调已死,自主上下文当立

这其中最具有代表性的是提词适应与优化算法。该类方法(如Alpha Evolve和GEPA)通过不断迭代优化,得到一个最优提示词实际使用。

然而,单一提示词的表达能力有限,往往难以全面严谨地表述复杂任务的所有需求。

对于这一缺陷,多提示词的相互协作是一个很自然的解决方案——单个提示词可能无法处理特定输入,但其他提示词可以弥补这一方面的性能损失。

如果能基于多个提示词生成的回答提取他们所达成的“共识”,AI系统就更有可能输出正确答案。

基于这一思想,西湖大学MAPLE实验室齐国君教授团队提出了基于“共识机制”的提示词组进化算法C-Evolve。

与既往仅优化单一提示词不同,C-Evolve旨在通过进化算法生成一组提示词。该组提示词在对输入信息进行独立处理后,通过提取所有输出结果的共识,以实现最优任务性能。

为实现这一目标,团队创新性地提出了“共识表决得分”这一进化指标,用于评估单个提示词在成组工作时的性能潜力,同时采用海岛算法提升组内个体的多样性。

通过多提示词共识机制所带来的增益,C-Evolve能够突破单一系统提示词的性能局限,显著提升系统整体性能。

具体下面来看。

共识机制

基于海岛的多提示词进化算法

完整的预热阶段算法如下:

共识表决阶段

△基于共识机制的多提示词进化算法

△共识表决阶段算法流程

提示词性能飙升

实验表明,C-Evolve同时适用于以Qwen3-8B为代表的开源模型和以GPT-4.1-mini为代表的闭源模型,并提升包括检索问答、数学推理、指令遵从在内的一系列任务性能。

从IFBench任务上的系统提示词优化过程示意图可以看出,3个岛会分别演化出关注不同侧重点的提示词,最终组成性能最好的提示词组。

△IFBench任务提示词组进化过程可视化图

对训练过程中种群特征进行降维并可视化,也可以看出在共识表决进化阶段,不同种群会显著地朝着不同方向进化,这保证了组内的多样性和互补性。

△C-Evolve进化过程中提示词种群分布

走向更高效的提示词优化

总而言之,这篇文章介绍了一种基于共识机制和进化算法的多提示词优化方法,C-Evolve。

通过系统性优化和融合多提示词的智能特征,该方法能够有效突破单一系统提示词的性能局限,无需参数微调即可实现算法效能的显著提升。

在上下文工程日益彰显其重要性的今天,如何通过更好地设计提示词,挖掘诸如Claude、GPT等成熟商业LLM的模型能力,是一个具有极高实际意义的课题。

“共识机制”为提示词优化提供了全新的思路,通过模拟生物进化与群体协作的动态过程,不仅提升了提示词的性能,还增强了模型在复杂任务中的适应能力,有望进一步释放大语言模型的潜力,推动智能系统向更高效、更自适应的方向发展。


    24小时新闻排行榜更多>>
  1. 李克强周年忌日 传安徽多大学紧急通知严查学生
  2. 川普登美军航母演说,高喊“若打仗就一定要赢”
  3. 传河南最大夜市被关停 摊贩与城管爆发冲突
  4. 传河北邯郸中学周边托管“小饭桌”着火 烧死多名学生
  5. “台独”沈伯洋被立案侦查
  6. 美联邦住房金融署:8月独栋住宅价格上涨
  7. 佛山教育局回应“春秋假”试点政策
  8. 钟绍军去向不明 中共三权继续分裂
  9. 曾与王菲齐名,如今病危
  10. 英“人才签证”拟扩至全球百校 申请人无需受聘
  11. 美日加强尖端科技合作 聚焦七大领域
  12. 美25州起诉政府 要求停摆期间维持食品券福利
  13. 钟睒睒第四次成中国首富,雷军、李书福进前十
  14. 芬太尼是无声杀手 洛官员警告家长提防
  15. 美日启动《技术繁荣协议》 打造科技联盟
  16. 四中全会后人事续震荡 军委审计长等出事
  17. 快自查!1.83亿电邮密码外泄 数百万账户恐遭殃!
  18. APEC峰会将至,反华情绪影响中韩互动
  19. 川普抵韩国 透露川习会谈部分议题
  20. 中国制度优越神话的崩解
  21. 内幕:张学政偷安世机密 拟解散欧洲分公司
  22. “中国香港”强化中国身份认同?
  23. 70后或为“最有钱”一代退休老人:错峰旅游主力
  24. 俄罗斯有多穷?莫斯科有多富?
  25. 俄兵员不足 明年起全年征兵 离战争总动员只差一步
  26. 川普政府与西屋电气签协议!在全美盖新核电厂
  27. 美空军飓风猎人飞入梅丽莎飓风 捕捉罕见画面
  28. iPad重大升级,真的要取代笔电了
  29. 英伟达斥资10亿美元入股诺基亚
  30. 香港中文大学副校长:构建科技成果转化生态链
  31. 为何泡沫能在众目睽睽之下继续膨胀?
  32. 暗示放弃对华贸易调查 川普预告习近平2026年访美
  33. 组图:飓风梅丽莎袭牙买加 加勒比地区酿7死
  34. 北加7命爆炸桉嫌犯落网
  35. 黄仁勋:希望川普能引导出口政策走向
  36. 川普在APEC商业领袖峰会上发表讲话
  37. 【翻墙必看】上海中介揭秘楼市新政不灵了
  38. 美参议员要委国总统“快逃去中俄” 美要整顿西半球
  39. 科学家构建新型超高强钢
  40. 美军机飞入梅丽莎飓风眼 拍摄到罕见画面
  41. 我花了一百多万,把一个全女店开倒闭了
  42. 胡润百富榜:赵长鹏1900亿身家排第13
  43. 极阳大凶日!九九“重阳节”须知3个禁忌
  44. 最特殊的帝都:莫斯科有多富?俄罗斯有多穷?
  45. 川普“口误”,将掀起惊涛骇浪
  46. 亚太经合会:台湾代表团争取与川普会面
  47. 议员:为何捍卫中国宗教自由对美国如此重要
  48. 美新创公司Substrate芯片制造工具媲美ASML
  49. AI杀死在线教育?美国巨头市值暴跌99% 宣布大裁员
  50. 联合国秘书长:摄氏1.5度防线失守 气候灾难不可避免
  51. 布鲁克林发生连环袭击案
  52. 东北的燕子,真是冻死的?
  53. 美印裔老板逼员工做500俯卧撑领工资 最终死于…
  54. 美国大使:新年前加美无望达成协议
  55. 高市早苗宴请川普 菜单曝光:体现对川普百般示好
  56. 美中贸易战火未波及 美企进博会参展面积第一
  57. 以总理指哈马斯违反协议 下令空袭加沙
  58. 共识机制,自我进化:微调已死
  59. 美参议院通过决议 否决川普对巴西征关税
  60. “十五五”规划公布 分析:面临结构性困境