返回顶部
a

ai-harness-engineeringAI工程化

|

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
117
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

ai-harness-engineering

Harness Engineering - AI驾驭工程错题本

核心理念

Harness Engineering(AI驾驭工程):AI时代程序员的核心工作不是写代码,而是设计规则、约束、反馈、调度体系,让AI安全、可靠、高效工作,同时持续修正AI错误。

本 skill 是 OpenClaw 的自省机制,记录所有被验证的错误和用户需求,形成错误台账,驱动模型进化,避免重复犯错。



一、核心功能概览


功能说明
错误记录记录所有被验证的错误、幻觉、失误
功能请求跟踪
跟踪用户想要但当前没有的功能 |
| 自动触发 | Hook机制自动检测纠正词和命令失败 |
| 自动提升 | 将重要学习提升到workspace文件 |
| 统计面板 | 可视化错误统计(今日/本周/本月/全部) |
| 错误模式库 | 12种常见错误模式供参考 |
| 定期回顾 | 周期性回顾机制,持续优化 |


二、存储结构

2.1 错误台账 (error_ledger.jsonl)

json
{errorid:HE-20260401-0001,timestamp:2026-04-01T12:34:56+08:00,scene:代码,errortype:代码错误,question:用户原始问题,wronganswer:错误回答摘要,correctanswer:正确答案,reason:错误原因,fix_status:未修复,level:中,source:用户纠正,tags:[代码,Python]}

2.2 功能请求台账 (feature_ledger.jsonl)

json
{featureid:FR-20260401-0001,timestamp:2026-04-01T12:34:56+08:00,featurename:功能名称,user_context:用户为什么需要这个功能,complexity:简单|中等|复杂,status:pending,priority:低|中|高,source:用户请求}

2.3 学习台账 (learnings_ledger.jsonl)

重要学习、纠正、知识差距、最佳实践都记录在这里。

json
{learningid:LRN-20260401-0001,timestamp:2026-04-01T12:34:56+08:00,category:correction|bestpractice|knowledgegap|simplifyharden,summary:一句话描述,details:详细上下文,suggestedaction:建议采取的行动,status:pending|promoted|resolved,source:conversation|error|userfeedback,patternkey:pattern.name,recurrencecount:1,firstseen:2026-04-01,lastseen:2026-04-01,promoted_to:}

2.4 Workspace提升目标

学习类型提升到
行为模式、沟通风格SOUL.md
工作流程、自动化
AGENTS.md | | 工具使用、集成技巧 | TOOLS.md | | 项目事实、约定 | MEMORY.md |

三、自动触发机制

3.1 检测触发词

当用户发送以下内容时,立即记录

错误纠正

  • - 不对,应该是...
  • 错了,正确答案是...
  • Actually, ...
  • 这样不对
  • No, thats wrong...
  • Youre wrong about...

功能请求

  • - 能不能... / Can you also...
  • 希望你能... / I wish you could...
  • Is there a way to...
  • 为什么不能... / Why cant you...

知识差距

  • - 用户提供了你不知道的信息
  • 你引用的文档已过时
  • API行为与你的理解不符

命令失败

  • - 命令返回非零退出码
  • 异常或堆栈跟踪
  • 超时或连接失败

3.2 记录流程

  1. 1. 检测到触发词 → 立即记录
  2. 生成唯一ID → HE-YYYYMMDD-XXXX / FR-YYYYMMDD-XXXX / LRN-YYYYMMDD-XXXX
  3. 写入对应台账 → errorledger.jsonl / featureledger.jsonl / learnings_ledger.jsonl
  4. 相似检测 → 检查是否有相似记录
  5. 状态追踪 → 设置初始状态为未处理
  6. 用户确认 → 回复用户已记录

四、自动进化机制(核心)

本 skill 实现了闭环自进化,通过以下三种机制确保错误不会重复:

4.1 定时自动提升(每2小时)

原理:当学习记录的 recurrence_count >= 3 时,自动写入 workspace 文件

配置 Cron Job
bash

每2小时自动检查并提升


python3 {SKILLDIR}/scripts/promote.py --action autopromote

自动提升逻辑

if recurrence_count >= 3:
if category == correction:
promote to SOUL.md # 行为纠正
elif category == best_practice:
promote to AGENTS.md # 最佳实践
elif category == knowledge_gap:
promote to MEMORY.md # 知识更新
else:
promote to TOOLS.md # 工具技巧

4.2 错误摘要注入(Session 启动时)

原理:每次 session 启动时,自动读取错误台账摘要并注入到上下文

实现方式:通过 OpenClaw system event 触发

python

每次 session 启动自动执行


python3 {SKILLDIR}/scripts/injectsummary.py --action session_start

注入内容格式

【HarnessEngineering 错误台账摘要 - 最近5条】

  1. 1. [代码错误] 未指定文件编码导致乱码 (重复2次)
  2. [逻辑错误] 条件判断遗漏边界情况 (重复3次) ⚠️ 需提升
  3. [漏信息] 安装步骤漏写依赖安装

【已规避的错误模式】

  • - Python 3.12 未移除 GIL
  • CSV 文件需使用 utf-8-sig 编码

4.3 回答前自检(每次回答时)

原理:在生成回答前,自动查询错误台账,如果涉及相似问题则参考正确答案

实现方式:定义在 SKILL.md 中的强制规则,每次回答前必须执行

自检流程

  1. 1. 用户提问 → 提取关键词
  2. 查询 error_ledger.jsonl 中相似问题 (相似度 > 50%)
  3. 如果找到相似错误:
- 提取 correct_answer 作为参考 - 在回答开头标注 [⚠️ 规避历史错误: HE-xxxx]
  1. 4. 如果 recurrence_count >= 3:
- 标记为高频错误,优先规避
  1. 5. 正常生成回答,但参考正确答案

示例

用户问:Python 3.12 有什么新特性?

自检结果:发现相似错误 HE-20260401-0001

  • - 错误类型:事实错误
  • recurrencecount: 2
  • correctanswer: Python 3.12 未移除 GIL,只是提供了 sub-interpreter 支持

回答:[⚠️ 规避历史错误: HE-20260401-0001]
Python 3.12 的主要新特性包括:

  1. 1. ... (参考正确答案是未移除GIL)

- 标记为高频错误,需提升
- 在回答中标注 [高频错误,已记录]

4.4 自动进化工作流图

┌─────────────────────────────────────────────────────────────┐
│ 自动进化闭环 │
└─────────────────────────────────────────────────────────────┘


┌─────────────────────────────────────────────────────────────┐
│ 用户纠正错误 → 记录到 error_ledger.jsonl │
└─────────────────────────────────────────────────────────────┘


┌─────────────────────────────────────────────────────────────┐
│ Cron Job (每2小时) │
│ → promote.py --action auto_promote │
│ → recurrence_count >= 3 → 自动写入 workspace │
└─────────────────────────────────────────────────────────────┘

┌─────────────┼─────────────┐
▼ ▼ ▼
SOUL.md AGENTS.md TOOLS.md
(行为) (工作流) (工具)


┌─────────────────────────────────────────────────────────────┐
│ Session 启动 → inject_summary.py → 错误摘要注入上下文 │
└─────────────────────────────────────────────────────────────┘


┌─────────────────────────────────────────────────────────────┐
│ 回答前 → preanswercheck.py → 查询相似错误 → 规避 │

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ai-harness-engineering-1775889675 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ai-harness-engineering-1775889675 技能

通过命令行安装

skillhub install ai-harness-engineering-1775889675

下载

⬇ 下载 ai-harness-engineering v1.0.0(免费)

文件大小: 42.39 KB | 发布时间: 2026-4-12 08:45

v1.0.0 最新 2026-4-12 08:45
Initial release with automated error and learning tracking, supporting self-improving AI governance.

- Added comprehensive scripts for recording, querying, summarizing, and promoting errors, feature requests, and learning events.
- New ledger files: `error_ledger.jsonl`, `feature_ledger.jsonl`, `learnings_ledger.jsonl` for structured tracking.
- Implemented auto-promotion of frequent learnings to workspace artifacts (SOUL.md, AGENTS.md, TOOLS.md, MEMORY.md) via scheduled tasks.
- Automated error summary injection and pre-answer checks to avoid repeated mistakes.
- Removed legacy README and obsolete reference/checklist files; fully revised documentation in SKILL.md with updated workflow and mechanisms.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部