返回顶部
a

autooptimise自动优化

Autonomously optimise any OpenClaw skill using a benchmark-driven experiment loop. Scores skill outputs 0-10 across 4 dimensions, identifies the lowest-scoring pattern, proposes a targeted SKILL.md change, re-tests, and keeps or discards based on measured improvement. Use when asked to: optimise my [skill] skill, run autooptimise on [skill], benchmark my [skill] skill, improve my skill overnight.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
94
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

autooptimise

autooptimise

针对OpenClaw的自主基准驱动技能优化。灵感来源于Andrej Karpathy的autoresearch——相同的修改→测试→评分→保留/丢弃循环,但应用于智能体技能质量而非GPU训练。

触发短语

  • - 优化我的天气技能
  • 对[技能名称]运行autooptimise
  • 对我的[技能名称]技能进行基准测试
  • 通宵改进我的技能

关键文件

文件用途
benchmark/tasks.json测试任务套件(提示词+预期质量)
benchmark/scorer.md
LLM评判评分标准 | | runner/run_experiment.md | 自主循环指令(下一步加载此文件) | | runner/experiment_log.md | 自动创建的运行日志(已加入gitignore) |

运行方式

  1. 1. 阅读runner/run_experiment.md——其中包含完整的循环指令
  2. 若未指定目标技能,则与用户确认
  3. 执行循环(最多3次迭代)
  4. 提交修改方案供人工审批——切勿自动应用

评分标准

使用可用的最佳LLM评判模型(优先选择强推理模型)。每项任务按0-10分评分,评估维度包括:

  • - 准确性——正确答案/正确调用工具
  • 简洁性——无填充内容,无多余文本
  • 工具使用——正确的工具和参数
  • 格式规范——输出符合预期格式

完整评分标准:benchmark/scorer.md

安全规则

  • - 切勿自动应用修改。 始终展示差异对比并等待明确的人工审批。
  • 运行期间切勿修改 benchmark/tasks.json 或 benchmark/scorer.md。
  • v0.1版本每次运行不得超过3次迭代。
  • 将每次操作记录到runner/experiment_log.md中。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 autooptimise-1776020822 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 autooptimise-1776020822 技能

通过命令行安装

skillhub install autooptimise-1776020822

下载

⬇ 下载 autooptimise v0.1.0(免费)

文件大小: 14.2 KB | 发布时间: 2026-4-13 09:26

v0.1.0 最新 2026-4-13 09:26
- Initial release of autooptimise: Autonomous benchmark-driven skill improvement for OpenClaw. Measure quality objectively, propose targeted changes, validate with live testing.
- Implements a modify → test → score → keep/discard experiment loop inspired by autoresearch.
- Scores skills 0–10 across four dimensions: Accuracy, Conciseness, Tool usage, and Formatting.
- Identifies weakest performance areas, proposes targeted SKILL.md changes, and re-tests up to 3 iterations per run.
- Always presents proposed changes for human approval; never auto-applies modifications.
- Includes clear safety rules and logging; does not alter benchmarks or scoring rubrics during runs.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部