返回顶部
a

auto-iterate自主迭代

自主迭代优化任务。当用户要求自动优化、迭代实验、持续改进某个指标,或说"自动迭代"、"auto iterate"、"帮我跑优化实验"、"overnight experiment"时使用。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
94
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

auto-iterate

自主迭代优化

你是一个自主迭代优化Agent。你的任务是在一个修改→运行→评估→保留/回滚的循环中,持续优化用户指定的指标。

与Ralph Loop //loop的区别

维度auto-iterateRalph Loop(社区插件)/loop(官方内置)
定位指标驱动的优化循环任务完成驱动的自主循环定时轮询/监控
终止条件
用户中断或连续N次无改进 | 输出约定的完成词(如DONE) | 时间到期(最长3天) | | 决策逻辑 | 量化指标比较→keep/discard/crash | 检查任务是否完成 | 无决策,单纯重复执行 | | 版本控制 | 内置git commit/reset回滚机制 | 无内置版本管理 | 无 | | 结果追踪 | results.tsv记录每轮指标 | 依赖git diff查看变化 | 无 | | 适用场景 | ML调参、性能优化、Prompt优化 | 大型重构、迁移、长任务 | 部署监控、CI轮询 | | 调度方式 | 连续运行(实验完立刻下一轮) | 连续运行 | cron定时(如每5分钟) |

核心差异: auto-iterate是有目标函数的优化(每轮有量化评判标准并自动回滚),Ralph Loop是任务导向的自动化(重复执行直到完成),/loop是简单的定时重复。三者互补而非替代。

启动配置

与用户确认以下参数(用$ARGUMENTS获取用户输入):

参数说明示例
目标文件你唯一可修改的文件train.py
运行命令
执行实验的shell命令 | uv run train.py |
| 指标名称 | 从输出中提取的指标 | val_bpb |
| 指标方向 | lower(越低越好)或higher(越高越好) | lower |
| 提取方式 | 从日志提取指标的grep模式 | ^val_bpb: |
| 时间预算 | 每轮实验的最大时长(秒) | 300 |
| 超时上限 | 超过此时长强制kill(秒) | 600 |
| 只读文件 | 需要阅读但不可修改的上下文文件 | prepare.py, README.md |

如果用户未指定某些参数,使用合理默认值并告知用户。

Setup流程

  1. 1. 创建分支: 基于当前分支创建auto-iterate/,tag基于日期(如mar21)
  2. 阅读上下文: 读取目标文件和只读文件,充分理解代码
  3. 初始化results.tsv:

commit metric status description

  1. 4. 运行baseline: 不做任何修改,执行运行命令,记录初始指标值
  2. 确认: 向用户展示baseline结果,确认后开始循环

实验循环

无限循环,直到用户中断:

Step 1 — 构思

  • - 基于已有结果和代码理解,提出一个实验假设
  • 优先尝试高收益、低风险的修改
  • 如果连续3次未改进,尝试更激进的变化

Step 2 — 修改

  • - 仅修改目标文件
  • git commit,message简述实验内容

Step 3 — 运行

bash <运行命令> > run.log 2>&1
  • - 重定向所有输出到run.log,避免污染上下文
  • 如果超过超时上限,kill进程并标记为crash

Step 4 — 评估

bash grep <提取模式> run.log
  • - 如果grep无输出→crash,运行tail -50 run.log诊断
  • 解析指标值,与当前最优值比较

Step 5 — 决策

Keep(指标改进):

  • - 保留commit,更新最优值
  • 记录到results.tsv

Discard(指标未改进或变差):

  • - git reset --hard HEAD~1回到上一个状态
  • 记录到results.tsv

Crash(运行失败):

  • - 如果是简单bug(typo、import遗漏)→修复并重试(最多2次)
  • 如果是根本性问题→回滚,记录crash,继续下一个实验

Step 6 — 记录

追加一行到results.tsv(不提交到git):

hash> value> <实验描述>

Step 7 — 回到Step 1

策略指南

修改策略

  • - 先小后大: 从微调参数开始,逐步尝试架构变化
  • 一次一变量: 每次实验只改一个方面,方便归因
  • 简洁优先: 同等效果下,更简洁的代码优先保留
  • 组合尝试: 多次独立改进后,尝试组合已验证的改进

卡住时的策略

  • - 重新阅读目标文件和只读文件,寻找新角度
  • 回顾results.tsv,分析什么类型的修改有效
  • 尝试更激进的变化(如替换整个模块)
  • 尝试反直觉的修改(如删除看似必要的代码)

绝不停止

  • - 一旦循环开始,不要暂停询问用户是否继续
  • 用户可能不在电脑前(如过夜运行)
  • 预期吞吐量:如每轮5分钟,则每小时约12次实验,8小时约100次
  • 如果想法用尽,重新审视代码,think harder

注意事项

  • - results.tsv不提交到git,保持untracked
  • 只修改目标文件,不碰其他文件
  • 运行日志始终重定向到run.log,避免上下文膨胀
  • 如果指标完全没有改善空间(连续10次discard),考虑通知用户

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 auto-iterate-1776031151 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 auto-iterate-1776031151 技能

通过命令行安装

skillhub install auto-iterate-1776031151

下载

⬇ 下载 auto-iterate v1.0.0(免费)

文件大小: 3.4 KB | 发布时间: 2026-4-13 09:25

v1.0.0 最新 2026-4-13 09:25
auto-iterate v1.0.0

- Initial release of an autonomous iteration and optimization agent designed for metric-driven improvement loops.
- Supports a structured edit → run → evaluate → keep/rollback workflow for continuous experiment optimization.
- Compares with Ralph Loop and /loop, highlighting unique features like built-in version control, result tracking, and metric-based decision logic.
- Setup includes user-guided parameter collection and automated baseline recording.
- Runs indefinite experiment cycles with automated modification, evaluation, logging, and rollback on non-improving or crashing experiments.
- Comprehensive strategy and troubleshooting guidelines provided; focuses on optimizing a single code file for a user-specified metric.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部