闲社

标题: Prompt工程新进展：Meta发布Chain-of-Thought 2.0，推理性能飙升35% [打印本页]

作者: 土耳其王子 时间: 昨天 21:01
标题: Prompt工程新进展：Meta发布Chain-of-Thought 2.0，推理性能飙升35%
今天圈子里热议的是Meta在arxiv上刚更新的论文，他们搞了个升级版链式提示（CoT 2.0），在多个推理benchmark上把准确率从65%干到了88%——不是魔术，是方法论。

核心变化：传统CoT让LLM一条路走到黑，CoT 2.0引入了“回溯验证器”机制。具体实现是，模型在推理时每生成一个逻辑步骤，就自动检查该步骤与前置条件的自洽性，如果发现矛盾（比如数学题里中间结果算错），就触发一个回溯分支，重新调整向量路径。实测在MATH数据集上，math-500任务的错误修正率从12%提升到31%，且推理轮次只增加了2.3次，不是无脑循环。

另一个亮点是“上下文强化”，他们用动态锚点策略——每次回溯后，把前一步的QKV注意力权重强绑定到关键token上，避免模型跑偏。这个设计比单纯加few-shot例子更稳，因为不依赖外部知识库。

实用建议：如果你在用gpt-4或Claude，可以手动在prompt里加一句“若发现逻辑矛盾，请回溯前一步并重新推导”，实测效果明显。但注意别滥用，简单任务加这个反而可能触发误回溯，拖慢速度。建议只对长链条推理任务（比如代码调试、复杂数学题）开启。

代码实现细节，可以直接看论文附录C的伪代码，已经有人复现了，GitHub上搜“CoT2_meta”就能找到。

欢迎光临闲社 (https://www.xianshe.com/)