Agent Self-Governance

Five protocols that prevent agent failure modes: losing context, false completion claims, persona drift, wasteful spending, and infrastructure amnesia.

1. WAL (Write-Ahead Log)

Rule: Write before you respond. If something is worth remembering, WAL it first.

Trigger	Action Type	Example
User corrects you	INLINECODE0	"No, use Podman not Docker"
Key decision

CODEBLOCK0

Integration Points

- Session start → replay to recover lost context
User correction → append BEFORE responding
Pre-compaction flush → flush-buffer then write daily memory
During conversation → buffer-add for less critical items

2. VBR (Verify Before Reporting)

Rule: Don't say "done" until verified. Run a check before claiming completion.

CODEBLOCK1

When to VBR

- After code changes → INLINECODE8
After file creation → INLINECODE9
After git push → INLINECODE10
After sub-agent task → verify the claimed output exists

3. ADL (Anti-Divergence Limit)

Rule: Stay true to your persona. Track behavioral drift from SOUL.md.

CODEBLOCK2

Anti-Patterns Tracked

- Sycophancy — "Great question!", "I'd be happy to help!"
Passivity — "Would you like me to", "Shall I", "Let me know if"
Hedging — "I think maybe", "It might be possible"
Verbosity — Response length exceeding expected bounds

Persona Signals (Positive)

- Direct — "Done", "Fixed", "Ship", "Built"
Opinionated — "I'd argue", "Better to", "The right call"
Action-oriented — "Spawning", "On it", "Kicking off"

4. VFM (Value-For-Money)

Rule: Track cost vs value. Don't burn premium tokens on budget tasks.

CODEBLOCK3

Task → Tier Guidelines
Task Type Recommended Tier Models
Monitoring, formatting, summarization Budget GLM, DeepSeek, Haiku
Code generation, debugging, creative
Standard | Sonnet, Gemini Pro |

Task Type	Recommended Tier	Models
Monitoring, formatting, summarization	Budget	GLM, DeepSeek, Haiku
Code generation, debugging, creative

| Architecture, complex analysis | Premium | Opus, Sonnet+thinking |

When to Check VFM

- After spawning sub-agents → log cost and outcome
During heartbeat → run suggest for optimization tips
Weekly review → run report for cost breakdown

5. IKL (Infrastructure Knowledge Logging)

Rule: Log infrastructure facts immediately. When you discover hardware specs, service configs, or network topology, write it down BEFORE continuing.

Triggers
Discovery Type Log To Example
Hardware specs TOOLS.md "GPU server has 3 GPUs: RTX 3090 + 3080 + 2070 SUPER"
Service configs
TOOLS.md | "ComfyUI runs on port 8188, uses /data/ai-stack" |

Discovery Type	Log To	Example
Hardware specs	TOOLS.md	"GPU server has 3 GPUs: RTX 3090 + 3080 + 2070 SUPER"
Service configs

Commands to Run on Discovery

CODEBLOCK4

The IKL Protocol

1. SSH to new server → Run hardware/service discovery commands
Before responding → Update TOOLS.md with specs
New service discovered → Log port, path, config location
Credentials obtained → Encrypt and store in memory/encrypted/

Anti-Pattern: "I'll Remember"

❌ "The GPU server has 3 GPUs" (only in conversation) ✅ "The GPU server has 3 GPUs" → Update TOOLS.md → then continue

Memory is limited. Files are permanent. IKL before you forget.

智能体自治

五项防止智能体故障模式的协议：上下文丢失、虚假完成声明、人格漂移、资源浪费和基础设施遗忘症。

1. WAL（预写日志）

规则：先写后答。 如果某件事值得记住，先写入WAL。

触发条件	操作类型	示例
用户纠正你	correction	不，用Podman而不是Docker
关键决策

bash

先写后答

python3 scripts/wal.py append correction 用Podman而不是Docker

工作缓冲区（批量处理，压缩前刷新）

python3 scripts/wal.py buffer-add decision 某个决策 python3 scripts/wal.py flush-buffer

会话启动：重放丢失的上下文

python3 scripts/wal.py replay

合并重放条目后

python3 scripts/wal.py mark-applied id> id>

维护

python3 scripts/wal.py status python3 scripts/wal.py prune --keep 50

集成点

- 会话启动 → replay 恢复丢失的上下文
用户纠正 → 在回复前执行 append
压缩前刷新 → flush-buffer 然后写入日常记忆
对话过程中 → 对非关键项使用 buffer-add

2. VBR（先验证后报告）

规则：验证通过前别说完成。 在声称完成前先运行检查。

bash

验证文件是否存在

python3 scripts/vbr.py check task123 file_exists /path/to/output.py

验证文件最近是否被修改

python3 scripts/vbr.py check task123 file_changed /path/to/file.go

验证命令是否成功执行

python3 scripts/vbr.py check task123 command cd /tmp/repo && go test ./...

验证git是否已推送

python3 scripts/vbr.py check task123 git_pushed /tmp/repo

记录验证结果

python3 scripts/vbr.py log task123 true 所有测试通过

查看通过/失败统计

python3 scripts/vbr.py stats

何时使用VBR

- 代码变更后 → check command go test ./...
文件创建后 → check fileexists /path
git推送后 → check gitpushed /repo
子智能体任务完成后 → 验证声称的输出是否存在

3. ADL（防漂移限制）

规则：忠于你的人格设定。 追踪与SOUL.md的行为偏差。

bash

分析回复中的反模式

python3 scripts/adl.py analyze 好问题！我很乐意帮你解决这个问题！

记录行为观察

python3 scripts/adl.py log id> antisycophancy 回复中使用了好问题！ python3 scripts/adl.py log id> personadirect 未经许可直接推送修复

计算偏差分数（0=对齐，1=完全漂移）

python3 scripts/adl.py score

检查是否超过阈值

python3 scripts/adl.py check --threshold 0.7

重新校准后重置

python3 scripts/adl.py reset

追踪的反模式

- 谄媚 — 好问题！、我很乐意帮忙！
被动 — 你想让我、我是否应该、请告诉我
含糊 — 我觉得可能、也许有可能
冗长 — 回复长度超出预期范围

人格信号（正面）

- 直接 — 完成、已修复、发布、已构建
有主见 — 我认为、最好是、正确的选择
行动导向 — 正在启动、处理中、开始执行

4. VFM（性价比）

规则：追踪成本与价值。 不要在预算任务上浪费高级令牌。

bash

记录已完成任务及其成本

python3 scripts/vfm.py log monitoring glm-4.7 37000 0.03 0.8

计算VFM分数

python3 scripts/vfm.py score

按模型和任务分类的成本明细

python3 scripts/vfm.py report

获取优化建议

python3 scripts/vfm.py suggest

任务→层级指南
任务类型推荐层级模型
监控、格式化、摘要预算级 GLM、DeepSeek、Haiku
代码生成、调试、创意
标准级 | Sonnet、Gemini Pro |

任务类型	推荐层级	模型
监控、格式化、摘要	预算级	GLM、DeepSeek、Haiku
代码生成、调试、创意

| 架构设计、复杂分析 | 高级 | Opus、Sonnet+思考 |

何时检查VFM

- 生成子智能体后 → 记录成本和结果
心跳检测时 → 运行 suggest 获取优化建议
每周回顾 → 运行 report 查看成本明细

5. IKL（基础设施知识记录）

规则：立即记录基础设施信息。 发现硬件规格、服务配置或网络拓扑时，在继续操作前立即记录下来。

触发条件
发现类型记录位置示例
硬件规格 TOOLS.md GPU服务器有3块GPU：RTX 3090 + 3080 + 2070 SUPER
服务配置
TOOLS.md | ComfyUI运行在端口8188，使用/data/ai-stack |

发现类型	记录位置	示例
硬件规格	TOOLS.md	GPU服务器有3块GPU：RTX 3090 + 3080 + 2070 SUPER
服务配置

发现时运行的命令

bash

硬件发现

nvidia-smi --query-gpu=index,name,memory.total --format=csv lscpu | grep -E Model name|CPU\(s\)|Thread free -h df -h

服务发现

systemctl list-units --type=service --state=running docker ps # 或 podman ps ss -tlnp | grep LISTEN

网络发现

ip addr show cat /etc/hosts

IKL协议

1. SSH到新服务器 → 运行硬件/服务发现命令
回复前 → 用规格信息更新TOOLS.md
发现新服务 → 记录端口、路径、配置位置
获取凭据 → 加密并存储在memory/encrypted/中

反模式：我会记住的

❌ GPU服务器有3块GPU（仅在对话中提及） ✅ GPU服务器有3块GPU → 更新TOOLS.md → 然后继续

记忆是有限的。文件是永久的。在忘记之前执行IKL。

agent-self-governance智能体自治协议