共识机制，自我进化：微调已死-墙外头条

当前，人工智能领域正经历一场由“模型微调”向“上下文工程”的范式转变。

通过在输入中引入更明确的指令和更丰富详实的知识，“上下文工程”既无需投入高昂的训练成本，亦不依赖开源模型权重参数，同时能够为用户和开发者提供更强的可解释性，正逐渐成为构建高性能、可扩展且具备自我改进能力的 AI 系统的核心范式。

正因如此，“微调已死”成为了AI领域近期广泛认可的热门话题。

斯坦福新论文：微调已死，自主上下文当立

这其中最具有代表性的是提词适应与优化算法。该类方法（如Alpha Evolve和GEPA）通过不断迭代优化，得到一个最优提示词实际使用。

然而，单一提示词的表达能力有限，往往难以全面严谨地表述复杂任务的所有需求。

对于这一缺陷，多提示词的相互协作是一个很自然的解决方案——单个提示词可能无法处理特定输入，但其他提示词可以弥补这一方面的性能损失。

如果能基于多个提示词生成的回答提取他们所达成的“共识”，AI系统就更有可能输出正确答案。

基于这一思想，西湖大学MAPLE实验室齐国君教授团队提出了基于“共识机制”的提示词组进化算法C-Evolve。

与既往仅优化单一提示词不同，C-Evolve旨在通过进化算法生成一组提示词。该组提示词在对输入信息进行独立处理后，通过提取所有输出结果的共识，以实现最优任务性能。

为实现这一目标，团队创新性地提出了“共识表决得分”这一进化指标，用于评估单个提示词在成组工作时的性能潜力，同时采用海岛算法提升组内个体的多样性。

通过多提示词共识机制所带来的增益，C-Evolve能够突破单一系统提示词的性能局限，显著提升系统整体性能。

具体下面来看。

共识机制

基于海岛的多提示词进化算法

完整的预热阶段算法如下：

共识表决阶段

△基于共识机制的多提示词进化算法

△共识表决阶段算法流程

提示词性能飙升

实验表明，C-Evolve同时适用于以Qwen3-8B为代表的开源模型和以GPT-4.1-mini为代表的闭源模型，并提升包括检索问答、数学推理、指令遵从在内的一系列任务性能。

从IFBench任务上的系统提示词优化过程示意图可以看出，3个岛会分别演化出关注不同侧重点的提示词，最终组成性能最好的提示词组。

△IFBench任务提示词组进化过程可视化图

对训练过程中种群特征进行降维并可视化，也可以看出在共识表决进化阶段，不同种群会显著地朝着不同方向进化，这保证了组内的多样性和互补性。

△C-Evolve进化过程中提示词种群分布

走向更高效的提示词优化

总而言之，这篇文章介绍了一种基于共识机制和进化算法的多提示词优化方法，C-Evolve。

通过系统性优化和融合多提示词的智能特征，该方法能够有效突破单一系统提示词的性能局限，无需参数微调即可实现算法效能的显著提升。

在上下文工程日益彰显其重要性的今天，如何通过更好地设计提示词，挖掘诸如Claude、GPT等成熟商业LLM的模型能力，是一个具有极高实际意义的课题。

“共识机制”为提示词优化提供了全新的思路，通过模拟生物进化与群体协作的动态过程，不仅提升了提示词的性能，还增强了模型在复杂任务中的适应能力，有望进一步释放大语言模型的潜力，推动智能系统向更高效、更自适应的方向发展。