返回顶部
p

prompts提示工程工作流

Deep prompt engineering workflow—task spec, constraints, examples, evaluation sets, iteration protocol, regression testing, and safety alignment. Use when improving LLM outputs, shipping prompt changes, or building reusable prompt templates.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
109
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

prompts

提示工程(深度工作流)

提示词的行为类似于自然语言程序:它们需要规格说明测试版本控制——尤其是在生产环境中。

何时提供此工作流

触发条件:

  • - 提示词或系统消息变更;质量回退
  • 结构化输出(JSON)、工具调用或RAG锚定需求
  • 安全性或策略对齐需求

初始提供:

使用六个阶段:(1)定义任务与成功标准,(2)约束条件与格式,(3)少样本与风格,(4)构建评估集,(5)规范迭代,(6)发布、监控与回退。确认模型系列和延迟预算。



阶段1:定义任务与成功标准

目标: 明确的用户可见结果和失败模式(幻觉、遗漏、语气)。

退出条件: 用通俗语言描述的成功评估标准;列出超出范围的情况。



阶段2:约束条件与格式

目标: 必须/禁止规则;输出模式(JSON Schema、列表结构);长度限制。

实践方法

  • - 将系统(策略、角色)与用户(任务实例)分开
  • 在需要锚定事实时要求模型引用来源

阶段3:少样本与风格

目标: 仅在能减少歧义时使用示例——避免提示词过度膨胀。

实践方法

  • - 多样化的示例;避免过长的负面示例造成混淆

阶段4:构建评估集

目标: 具有预期属性的固定输入(不总是精确文本匹配)。

实践方法

  • - 相关时包含对抗性和多语言切片
  • 对关键提示词在CI中设置回归测试套件

阶段5:规范迭代

目标: 调试质量问题时每次只改变一个主要变量。

实践方法

  • - A/B测试措辞时使用相同的温度设置进行比较
  • 在生产环境中记录输出对应的提示词版本ID

阶段6:发布、监控与回退

目标: 金丝雀式提示词变更;监控隐式信号(点赞、编辑、任务完成)。



最终审查清单

  • - [ ] 任务和评估标准已定义
  • [ ] 约束条件和输出格式已明确
  • [ ] 评估集已版本化;存在回归路径
  • [ ] 迭代日志规范;提示词版本已追踪
  • [ ] 生产监控和回滚计划已就绪

有效指导的技巧

  • - 清晰胜过巧妙——简短明确的指令往往更有效。
  • 思维链:在推理有帮助时使用;必要时对最终用户隐藏思维链。
  • 大语言模型评估技能对齐,用于更大规模的测试框架设计。

处理偏差

  • - 对话 vs 批处理:批处理可以使用更严格的结构和更低的温度。
  • 多模态:明确说明图像细节可能如何使用或被忽略。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 prompts-1775975168 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 prompts-1775975168 技能

通过命令行安装

skillhub install prompts-1775975168

下载

⬇ 下载 prompts v1.0.0(免费)

文件大小: 1.99 KB | 发布时间: 2026-4-13 11:39

v1.0.0 最新 2026-4-13 11:39
- Initial release introducing a comprehensive, 6-stage prompt engineering workflow for LLM task design and iteration.
- Covers stages from task definition through constraints, examples, eval set creation, disciplined iteration, and safe deployment.
- Provides clear exit conditions, review checklist, and practical tips for production-grade prompt development.
- Addresses structured output, safety alignment, regression testing, and monitoring strategies.
- Designed for teams seeking robust, reusable, and test-driven prompt templates.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部