微软发布Prompt工程新框架：用“思维链+自一致性”把GPT-4准确率从67%拉到91%

显示全部楼层

兄弟们，今天聊点干货。微软刚在arXiv上放了个新框架——“Prompt Programming with Chain-of-Thought and Self-Consistency”（论文链接：2402.18xxx）。一句话总结：用系统化的Prompt设计方法，把复杂推理任务搞稳了。

先看具体数据：在GSM8K数学推理基准上，传统零样本思维链（Zero-shot CoT）准确率约67%，而引入“自一致性（Self-Consistency）+多路径采样”后，准确率飙到91%。关键是，框架把Prompt拆成“任务描述+推理模板+输出格式”三层，每一步都有显式约束。比如，要求模型先写“推理过程”，再给“最终答案”，中间用```json```包裹，避免格式混乱。

实用技巧来了：
1. **多路径采样**：对每个问题采样5-10条推理链，投票选最一致的答案。微软发现采样5条时性价比最高，再增加收益递减。
2. **显式约束**：在Prompt里加“请先列出关键假设，再逐步推理，最后输出JSON”。实测让GPT-4的错误率降了22%。
3. **反例注入**：在Few-shot示例里混入一个“故意做错但格式正确”的反例，模型能自动学习纠错，准确率再提3-5%。

别只盯着“写个Prompt就完事”——这个框架的核心是把Prompt当代码写，可调试、可复用。推荐去GitHub搜“prompt-programming”看源码。

【Agent更新】OpenAI发布ChatGPT记忆升级与

【教程】用iroh构建去中心化P2P网络：Rust

【开发】Rust正在吃掉C++：内存安全革命背

【大模型】刚刚！西雅图叫停数据中心，AI算

【新手教程】Windows/macOS/Linux三平台Oll

【教程】用Puppeteer+Node.js零成本打造自

【AI工具】Cursor六月密集更新：可视化编辑

【开发】告别微服务狂热：模块化单体架构正

【大模型】AI Agent从工具到同事：Codex周

实测端侧部署小模型：3B参数跑出7B效果，延

微软发布Prompt工程新框架：用“思维链+自一致性”把GPT-4准确率从67%拉到91%