返回顶部
m

meta-harness-evolver元进化器

End-to-end Meta-Harness evolution for Hoss (OpenClaw agent). Runs nightly at 3 AM via OpenClaw cron. Reads Hoss's current workspace configs (SOUL.md, IDENTITY.md, AGENTS.md, TOOLS.md, MEMORY.md), proposes harness modifications via a coding-agent proposer, evaluates against a benchmark, logs results to ~/hoss-evolution/, and posts a summary to the #research Discord channel. Triggered: (1) automatically via cron at 3 AM CDT, (2) when Tyler says "run harness evolution", "evolve Hoss", or "run meta-

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
88
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

meta-harness-evolver

元-框架进化器

该技能的功能

为Hoss(您的OpenClaw智能体)实现元-框架论文中的外循环优化。每天凌晨3点(美国中部时间),该技能将:

  1. 1. 读取 Hoss当前的工作空间配置及所有先前的进化日志
  2. 通过编码智能体子智能体提出针对性的框架修改方案
  3. 评估所提出的框架在约20个多样化任务场景基准测试中的表现
  4. 记录候选框架及其得分和执行轨迹到进化文件系统
  5. 发布摘要报告到#research Discord频道

元-框架循环

提议智能体 ──(文件系统访问)──► Hoss工作空间
▲ │
│ 提出框架
│ ▼
│ 在基准测试中评估
│ ▼
日志 ───┴── 存储:代码 + 得分 + 轨迹 ──► ~/hoss-evolution/

快速开始

Cron计划

  • - 每天凌晨3点(美国中部时间) — 通过 openclaw cron 配置
  • Cron命令:SKILL=meta-harness-evolution TASK=run_evolution openclaw run

手动触发

/openclaw run --skill meta-harness-evolver --task run_evolution

目录结构

~/hoss-evolution/
├── best/ # 迄今为止找到的最佳框架
│ └── current/
├── candidates/ # 所有已评估的框架
│ └── candidate_N/ # 每个候选框架一个目录
│ ├── harness/ # 提议的配置文件(SOUL.md等)
│ ├── eval_scores.json
│ └── traces/ # 执行轨迹
├── benchmark/ # 评估任务+评分器
│ └── scenarios/ # 约20个多样化任务场景
├── proposer/ # 提议智能体的工作空间
│ └── logs/ # 提议智能体自身的推理轨迹
└── evolution_log.jsonl # 完整运行历史

可进化的内容

Hoss的框架=包裹LLM大脑的配置:

文件控制内容
SOUL.md核心身份、个性、决策风格
IDENTITY.md
角色、语气、语调、签名模式 |
| AGENTS.md | 子智能体架构、协调协议 |
| TOOLS.md | 工具配置、凭证、关键主机 |
| MEMORY.md | 长期记忆结构、持久化内容 |
| HEARTBEAT.md | 活跃时间、检查优先级、告警阈值 |

约束条件(请勿修改):

  • - TOOLS.md中的凭证、API密钥或密钥
  • Git安全规则(切勿修改~/flume/中的git配置)
  • 安全敏感的groupPolicy设置

进化算法

  1. 1. 种子:以Hoss当前配置作为第0次迭代
  2. 提议:子智能体从~/hoss-evolution/candidates/读取完整历史,识别失败模式,提出1-2个针对性编辑
  3. 验证:在运行完整基准测试前进行轻量级导入/语法检查
  4. 评估:在所有20个基准测试场景中运行提议的框架,对每个场景评分
  5. 记录:存储候选框架+得分+提议智能体推理轨迹
  6. 选择:帕累托前沿(性能,简洁性)——提议智能体决定从哪些候选框架继续探索
  7. 重复:次晚的提议智能体可以读取所有先前候选框架,基于好的想法继续构建

论文关键见解

技能文本是最强的杠杆——它引导提议智能体。迭代提议智能体的提示/角色描述比改变迭代次数或种群规模效果更显著。

基准测试

基准测试位于 ~/hoss-evolution/benchmark/。请参阅 references/benchmark-design.md 了解如何设计场景,以及 references/harness-spec.md 了解完整的框架规范。

默认基准测试包含20个场景,涵盖以下类别:

  • - 记忆:从记忆文件中回忆、更新、综合
  • 代码:编写、审查、调试代码任务
  • 协调:生成子智能体、综合结果
  • 研究:网络搜索、获取、总结、综合
  • 通信:起草邮件、Discord消息、iMessages
  • 质量:发现错误、不一致、断链

每个场景包含:

  • - 具体的任务描述
  • 预期结果标准
  • 评分标准(每个场景0-3分:失败/部分通过/通过/优秀)

提议智能体

提议智能体是一个编码智能体子智能体(默认:编码器),它:

  • - 通过文件系统操作从 ~/hoss-evolution/candidates/ 读取所有先前候选框架
  • 识别失败/成功候选框架中的模式
  • 提出针对性、具体的编辑(而非全面重写)
  • 将提议的配置写入新的候选目录
  • 记录其推理轨迹,以便未来迭代可以在此基础上构建

提议智能体技能(传递给子智能体)

提议智能体的角色由 scripts/propose_harness.py 中的任务提示定义。关键约束:

  • - 只能对框架规范中的文件(SOUL.md、IDENTITY.md、AGENTS.md、TOOLS.md、MEMORY.md、HEARTBEAT.md)提出编辑
  • 在全面评估前必须通过轻量级验证
  • 应优先进行针对性编辑而非全面重写
  • 必须将推理轨迹记录到 proposer/logs/

工作流程步骤

步骤1:读取先前候选框架

bash

列出所有先前候选框架

ls ~/hoss-evolution/candidates/

读取最佳候选框架

cat ~/hoss-evolution/best/current/eval_scores.json

读取历史日志

tail -20 ~/hoss-evolution/evolution_log.jsonl

步骤2:运行提议智能体

bash

子智能体提议智能体读取~/hoss-evolution/并提出方案

通过加载此技能的openclaw run触发

步骤3:在基准测试前验证

bash

快速语法检查

bash ~/hoss-evolution/scripts/validate.sh

步骤4:运行基准测试

bash

在所有20个场景中评估候选框架

python3 ~/hoss-evolution/scripts/evaluate.py

步骤5:记录结果

bash

得分+轨迹自动写入候选目录

进化日志更新

步骤6:发布到Discord

bash

发布摘要到#research

python3 ~/hoss-evolution/scripts/posttoresearch.py

评分

最终得分=各场景加权平均值:

  • - 记忆任务:25%
  • 代码任务:25%
  • 协调:15%
  • 研究:20%
  • 通信:10%
  • 质量:5%

结果以帕累托前沿形式追踪:对每个候选框架,记录得分和复杂度(变更的大小/差异)。得分相同的情况下,更简单的框架优先。

资源

注意事项

  • - 提议智能体子智能体以 runtime=subagent 运行,而非ACP——它需要文件系统访问 ~/hoss-evolution/
  • Cron通过 openclaw cron 在此技能外部配置
  • 如果提议智能体未能生成有效候选框架,则跳过该次迭代(无惩罚)
  • 基准测试场景应足够多样化,确保没有单一策略可以操控所有场景
  • 进化工作空间不在 ~/.openclaw/ 内部——它位于 ~/hoss-evolution/,以保持与操作配置分离

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 meta-harness-evolver-1775924951 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 meta-harness-evolver-1775924951 技能

通过命令行安装

skillhub install meta-harness-evolver-1775924951

下载

⬇ 下载 meta-harness-evolver v1.0.0(免费)

文件大小: 23.75 KB | 发布时间: 2026-4-12 10:35

v1.0.0 最新 2026-4-12 10:35
Initial release: nightly Meta-Harness outer-loop evolution for OpenClaw agents

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部