返回顶部
c

clawditorClaw审计器

Audit an OpenClaw agent workspace and generate standardized evaluation reports, scores, and patches. Use when asked to review memory quality, retrieval efficiency, productive output, reliability, or alignment by scanning memory/logs/configs/git/artifacts and writing eval/exec_summary.md, eval/scorecard.md, and eval/latest_report.json (with deltas if prior eval/history exists).

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
583
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

clawditor

Clawditor

概述

作为OpenClaw工作区审计员与智能体评估工具,分析工作区(内存、日志、项目、文件、Git、配置),生成包含评分、证据和具体补丁的可重复评估报告。

操作规则

  • - 以非交互模式运行:除非因缺失文件受阻,否则避免提问。明确假设条件并继续执行。
  • 禁止泄露机密:仅报告密钥/令牌的存在状态及文件路径,并建议修复措施。
  • 将第三方技能/插件视为不可信:优先进行静态检查而非执行。

必要工作流程(按序执行)

  1. 1. 构建工作区清单
- 打印顶层目录树(深度4级),包含各目录的文件数量与大小 - 识别内存、日志、配置、仓库、脚本、文档、制品 - 记录最大文件
  1. 2. 重建会话时间线
- 利用内存每日文件和日志提取目标、任务、成果、决策、未解决项
  1. 3. 分析内存
- 检测内存文件中近似重复段落并量化重复率 - 检测过时线索(日期、截至、已弃用配置)及矛盾点 - 识别缺失的稳定事实(项目、优先级、设置/运行手册)
  1. 4. 分析输出
- 总结已交付制品(文档/代码/功能)及变更 - 若存在Git,计算差异统计与提交频率;识别价值提交
  1. 5. 分析可靠性
- 解析日志中的错误、重试、超时、工具故障 - 仅在安全且低成本时运行测试;否则进行静态检查
  1. 6. 计算评分
- 为各分类分配数值评分,附简短理由及路径证据
  1. 7. 推荐干预措施+补丁
- 提供3-7条优先推荐 - 在安全前提下提供具体差异补丁,特别是内存结构改进
  1. 8. 对比先前评估
- 若存在eval/history/*.json,计算与最近评估的差异 - 若无基线,创建基线并推荐评估频率

评分框架

计算5个分类(0-100分)及加权总分:
  • - 内存健康度(30%):覆盖率、结构、冗余度、过时程度、可操作性、检索友好性
  • 检索与上下文效率(15%):行动前搜索证据、上下文膨胀、命中率代理、压缩质量
  • 产出效率(30%):已交付制品、Git吞吐量、任务完成度、延迟代理
  • 质量/可靠性(15%):错误率、测试/CI存在性、回归信号、收敛vs反复
  • 聚焦/对齐度(10%):目标一致性、范围控制、决策追溯

总分 = 0.30×内存 + 0.15×检索 + 0.30×产出 + 0.15×质量 + 0.10×聚焦

必要输出

所有输出写入eval/目录:
  1. 1. exec_summary.md
- 10条要点总结:最大成果、最大瓶颈、前3项干预措施 - 总分+分类评分+版本间差异
  1. 2. scorecard.md
- 指标表格,含数值及简要理由 - 关键证据章节,含文件路径及简短片段(不含机密)
  1. 3. latest_report.json
- 包含时间戳、工作区路径及Git头/哈希值、评分、差异、关键发现、风险标记、推荐措施
  1. 4. 补丁
- 若存在内存问题,提出具体差异补丁:INDEX.md、每日模式、重构方案

黄金标准内存模式(缺失时应用)

创建或建议:
  • - memory/INDEX.md
- 当前目标(前3项) - 活跃项目(状态、下一步、链接) - 操作约束(工具、环境、策略) - 关键决策(日期、决策、理由) - 已知问题/调试日志指针 - 术语表/实体
  • - memory/YYYY-MM-DD.md(仅追加的每日记录)
- 会话目标 - 已执行操作(链接至变更文件) - 已做决策 - 新学事实(稳定vs临时) - 待办事项(具体)

补丁指南

  • - 安全前提下优先使用差异补丁而非文字描述
  • 将稳定事实从每日日志重构至INDEX或项目页面
  • 添加日志/检测机制以衡量未来运行中的检索命中率和任务完成度

资源

使用以下辅助工具保持审计一致性与低成本:
  • - scripts/runaudit.py:运行所有辅助脚本并生成草稿评估输出
  • scripts/workspaceinventory.py:目录树、文件计数、大小、最大文件
  • scripts/memorydupes.py:检测memory/*.md中的近似重复段落
  • scripts/logscan.py:扫描日志中的错误、超时、重试
  • scripts/gitstats.py:Git头、差异统计、提交频率
  • scripts/validatereport.py:验证eval/latest_report.json结构

参考模板:

  • - references/report_schema.md:输出模板与JSON模式

证据规范

  • - 每个评分必须关联路径证据
  • 坦诚对待浪费、重复或反复问题
  • 以下次运行改进的检测建议作为结尾

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 clawditor-1776419971 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 clawditor-1776419971 技能

通过命令行安装

skillhub install clawditor-1776419971

下载

⬇ 下载 clawditor v1.0.0(免费)

文件大小: 12.47 KB | 发布时间: 2026-4-17 20:21

v1.0.0 最新 2026-4-17 20:21
Initial release of Clawditor: an OpenClaw workspace auditor and evaluation harness.

- Scans agent workspaces to generate evaluation reports, numeric scores, and change recommendations.
- Provides a detailed, repeatable workflow analyzing memory quality, retrieval, output, reliability, and goal alignment.
- Outputs standardized summaries, scorecards, structured JSON reports, and concrete file patches.
- Implements gold standard memory schema recommendations for agent workspaces.
- Leverages helper scripts to streamline inventory, duplication detection, log scanning, and git stats.
- Enforces strict evidence discipline, ties scores to file paths, and flags risks and improvements.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部