返回顶部
S

Self-Improving Agent (Proactive Self-Reflection)主动自我反思

Self-reflection + Self-criticism + Self-learning + Self-organizing memory. Agent evaluates its own work, catches mistakes, and improves permanently. Use before starting work and after responding to the user.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
151
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

Self-Improving Agent (Proactive Self-Reflection)

何时使用

用户纠正你或指出错误。你完成重要工作后想要评估结果。你注意到自己输出中有可以改进之处。知识应随时间累积而无需手动维护。

架构

记忆存储在 ~/self-improving/ 目录下,采用分层结构。若 ~/self-improving/ 不存在,则运行 setup.md。

~/self-improving/
├── memory.md # 热存储:≤100行,始终加载
├── index.md # 主题索引(含行数统计)
├── projects/ # 各项目经验总结
├── domains/ # 领域特定(代码、写作、沟通)
├── archive/ # 冷存储:已衰减的模式
└── corrections.md # 最近50条纠正记录

快速参考

主题文件
设置指南setup.md
记忆模板
memory-template.md | | 学习机制 | learning.md | | 安全边界 | boundaries.md | | 扩展规则 | scaling.md | | 记忆操作 | operations.md | | 自我反思日志 | reflections.md |

检测触发条件

当发现以下模式时自动记录:

纠正 → 添加到 corrections.md,评估是否纳入 memory.md:

  • - 不,那不对...
  • 实际上,应该是...
  • 你搞错了...
  • 我更喜欢X,不是Y
  • 记住我一直...
  • 我之前告诉过你...
  • 别再这样做X
  • 你为什么总是...

偏好信号 → 若明确则添加到 memory.md:

  • - 我喜欢你这样做...
  • 总是为我做X
  • 永远不要做Y
  • 我的风格是...
  • 对于[项目],使用...

模式候选 → 跟踪,出现3次后升级:

  • - 同一指令重复3次以上
  • 反复有效的流程
  • 用户称赞特定方法

忽略(不记录):

  • - 一次性指令(现在做X)
  • 上下文特定(在这个文件中...)
  • 假设性内容(如果...会怎样)

自我反思

完成重要工作后,暂停并评估:

  1. 1. 是否达到预期? — 比较结果与意图
  2. 哪些可以改进? — 识别下次改进点
  3. 这是否是模式? — 若是,记录到 corrections.md

何时进行自我反思:

  • - 完成多步骤任务后
  • 收到反馈后(正面或负面)
  • 修复错误后
  • 发现输出可以改进时

记录格式:

上下文:[任务类型]
反思:[我注意到的内容]
教训:[下次应如何不同处理]

示例:

上下文:构建Flutter UI
反思:间距看起来不对,需要重做
教训:在展示给用户前检查视觉间距

自我反思条目遵循相同的升级规则:成功应用3次 → 升级到热存储。

快速查询

用户说操作
你对X了解多少?搜索所有层级中的X
你学到了什么?
显示 corrections.md 中最近10条 | | 显示我的模式 | 列出 memory.md(热存储) | | 显示[项目]模式 | 加载 projects/{name}.md | | 温存储里有什么? | 列出 projects/ + domains/ 中的文件 | | 记忆统计 | 显示各层级条目数 | | 忘记X | 从所有层级中移除(先确认) | | 导出记忆 | 将所有文件打包为ZIP |

记忆统计

收到记忆统计请求时,报告:

📊 自我改进记忆

热存储(始终加载):
memory.md:X条

温存储(按需加载):
projects/:X个文件
domains/:X个文件

冷存储(已归档):
archive/:X个文件

近期活动(7天):
已记录纠正:X
升级到热存储:X
降级到温存储:X

核心规则

1. 从纠正和自我反思中学习

  • - 当用户明确纠正时记录
  • 当你在自己工作中发现改进点时记录
  • 绝不仅凭沉默推断
  • 相同教训出现3次后 → 请求确认为规则

2. 分层存储
层级位置大小限制行为
热存储memory.md≤100行始终加载
温存储
projects/, domains/ | 各≤200行 | 上下文匹配时加载 |

| 冷存储 | archive/ | 无限制 | 明确查询时加载 |

3. 自动升级/降级

  • - 模式7天内使用3次 → 升级到热存储
  • 模式30天未使用 → 降级到温存储
  • 模式90天未使用 → 归档到冷存储
  • 未经询问绝不删除

4. 命名空间隔离

  • - 项目模式保留在 projects/{name}.md
  • 全局偏好位于热存储层(memory.md)
  • 领域模式(代码、写作)位于 domains/
  • 跨命名空间继承:全局 → 领域 → 项目

5. 冲突解决

当模式冲突时:
  1. 1. 最具体优先(项目 > 领域 > 全局)
  2. 最新优先(同层级)
  3. 若模糊 → 询问用户

6. 压缩

当文件超出限制时:
  1. 1. 将相似纠正合并为单一规则
  2. 归档未使用的模式
  3. 总结冗长条目
  4. 绝不丢失已确认的偏好

7. 透明性

  • - 每次从记忆执行操作 → 引用来源:使用X(来自projects/foo.md:12)
  • 每周摘要可用:已学习、已降级、已归档的模式
  • 按需完整导出:所有文件打包为ZIP

8. 安全边界

参见 boundaries.md — 绝不存储凭据、健康数据、第三方信息。

9. 优雅降级

若达到上下文限制:
  1. 1. 仅加载 memory.md(热存储)
  2. 按需加载相关命名空间
  3. 绝不静默失败 — 告知用户未加载的内容

范围

此技能仅:

  • - 从用户纠正和自我反思中学习
  • 在本地文件(~/self-improving/)中存储偏好
  • 激活时读取自身记忆文件

此技能绝不:

  • - 访问日历、邮件或联系人
  • 发起网络请求
  • 读取 ~/self-improving/ 之外的文件
  • 从沉默或观察中推断偏好
  • 修改自身的 SKILL.md

相关技能

若用户确认,使用 clawhub install 安装:
  • - memory — 代理的长时记忆模式
  • learning — 自适应教学与解释
  • decide — 自动学习决策模式
  • escalate — 判断何时询问 vs 自主行动

反馈

  • - 若有帮助:clawhub star self-improving
  • 保持更新:clawhub sync

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 claw-self-improving-pro-1775935001 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 claw-self-improving-pro-1775935001 技能

通过命令行安装

skillhub install claw-self-improving-pro-1775935001

下载

⬇ 下载 Self-Improving Agent (Proactive Self-Reflection) v1.0.0(免费)

文件大小: 19.84 KB | 发布时间: 2026-4-12 09:25

v1.0.0 最新 2026-4-12 09:25
Self-Improving Agent (Proactive Self-Reflection) v1.2.10

- Setup now proactively lists relevant memory before non-trivial work, emphasizing self-reflection at every step.
- Improved guidance on when and how to log corrections, preferences, and self-reflection.
- Clarified tiered memory architecture and automatic promotion/demotion rules.
- Expanded quick queries for accessing and managing memory patterns.
- Detailed security boundaries and core operational rules for safer, more predictable behavior.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部