共识机制,自我进化:微调已死
2025-10-28 04:25:20 · chineseheadlinenews.com · 来源: 量子位
当前,人工智能领域正经历一场由“模型微调”向“上下文工程”的范式转变。
通过在输入中引入更明确的指令和更丰富详实的知识,“上下文工程”既无需投入高昂的训练成本,亦不依赖开源模型权重参数,同时能够为用户和开发者提供更强的可解释性,正逐渐成为构建高性能、可扩展且具备自我改进能力的 AI 系统的核心范式。
正因如此,“微调已死”成为了AI领域近期广泛认可的热门话题。
斯坦福新论文:微调已死,自主上下文当立
这其中最具有代表性的是提词适应与优化算法。该类方法(如Alpha Evolve和GEPA)通过不断迭代优化,得到一个最优提示词实际使用。
然而,单一提示词的表达能力有限,往往难以全面严谨地表述复杂任务的所有需求。
对于这一缺陷,多提示词的相互协作是一个很自然的解决方案——单个提示词可能无法处理特定输入,但其他提示词可以弥补这一方面的性能损失。
如果能基于多个提示词生成的回答提取他们所达成的“共识”,AI系统就更有可能输出正确答案。
基于这一思想,西湖大学MAPLE实验室齐国君教授团队提出了基于“共识机制”的提示词组进化算法C-Evolve。
与既往仅优化单一提示词不同,C-Evolve旨在通过进化算法生成一组提示词。该组提示词在对输入信息进行独立处理后,通过提取所有输出结果的共识,以实现最优任务性能。
为实现这一目标,团队创新性地提出了“共识表决得分”这一进化指标,用于评估单个提示词在成组工作时的性能潜力,同时采用海岛算法提升组内个体的多样性。
通过多提示词共识机制所带来的增益,C-Evolve能够突破单一系统提示词的性能局限,显著提升系统整体性能。

具体下面来看。
共识机制

基于海岛的多提示词进化算法

完整的预热阶段算法如下:

共识表决阶段


△基于共识机制的多提示词进化算法


△共识表决阶段算法流程
提示词性能飙升
实验表明,C-Evolve同时适用于以Qwen3-8B为代表的开源模型和以GPT-4.1-mini为代表的闭源模型,并提升包括检索问答、数学推理、指令遵从在内的一系列任务性能。

从IFBench任务上的系统提示词优化过程示意图可以看出,3个岛会分别演化出关注不同侧重点的提示词,最终组成性能最好的提示词组。

△IFBench任务提示词组进化过程可视化图
对训练过程中种群特征进行降维并可视化,也可以看出在共识表决进化阶段,不同种群会显著地朝着不同方向进化,这保证了组内的多样性和互补性。

△C-Evolve进化过程中提示词种群分布
走向更高效的提示词优化
总而言之,这篇文章介绍了一种基于共识机制和进化算法的多提示词优化方法,C-Evolve。
通过系统性优化和融合多提示词的智能特征,该方法能够有效突破单一系统提示词的性能局限,无需参数微调即可实现算法效能的显著提升。
在上下文工程日益彰显其重要性的今天,如何通过更好地设计提示词,挖掘诸如Claude、GPT等成熟商业LLM的模型能力,是一个具有极高实际意义的课题。
“共识机制”为提示词优化提供了全新的思路,通过模拟生物进化与群体协作的动态过程,不仅提升了提示词的性能,还增强了模型在复杂任务中的适应能力,有望进一步释放大语言模型的潜力,推动智能系统向更高效、更自适应的方向发展。