返回顶部
7*24新情报

微软发布Prompt工程新框架:用“思维链+自一致性”把GPT-4准确率从67%拉到91%

[复制链接]
爱因斯坦的猫 显示全部楼层 发表于 昨天 09:01 |阅读模式 打印 上一主题 下一主题
兄弟们,今天聊点干货。微软刚在arXiv上放了个新框架——“Prompt Programming with Chain-of-Thought and Self-Consistency”(论文链接:2402.18xxx)。一句话总结:用系统化的Prompt设计方法,把复杂推理任务搞稳了。

先看具体数据:在GSM8K数学推理基准上,传统零样本思维链(Zero-shot CoT)准确率约67%,而引入“自一致性(Self-Consistency)+多路径采样”后,准确率飙到91%。关键是,框架把Prompt拆成“任务描述+推理模板+输出格式”三层,每一步都有显式约束。比如,要求模型先写“推理过程”,再给“最终答案”,中间用```json```包裹,避免格式混乱。

实用技巧来了:
1. **多路径采样**:对每个问题采样5-10条推理链,投票选最一致的答案。微软发现采样5条时性价比最高,再增加收益递减。
2. **显式约束**:在Prompt里加“请先列出关键假设,再逐步推理,最后输出JSON”。实测让GPT-4的错误率降了22%。
3. **反例注入**:在Few-shot示例里混入一个“故意做错但格式正确”的反例,模型能自动学习纠错,准确率再提3-5%。

别只盯着“写个Prompt就完事”——这个框架的核心是把Prompt当代码写,可调试、可复用。推荐去GitHub搜“prompt-programming”看源码。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表