返回顶部
c

cross-model-review双模型对抗审查

Adversarial plan review using two different AI models. Supports static mode (fixed roles) and alternating mode (models swap writer/reviewer each round, fully autonomous). Use when building features touching auth/payments/data models, or plans >1hr to implement. NOT for simple fixes, research tasks, or quick scripts.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.1.0
安全检测
已通过
740
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

cross-model-review

跨模型审查

元数据

yaml 名称: cross-model-review 版本: 2.0.0 描述: > 使用两种不同AI模型进行对抗性计划审查。 v2:交替模式——模型每轮互换编写者/审查者角色。 完全自主循环——轮次之间无需人工输入。 适用场景:构建涉及认证/支付/数据模型的功能, 实施时间超过1小时的计划。 不适用于:单文件修复、研究任务、快速脚本。 触发词: - 审查这个计划 - 交叉审查 - 挑战这个 - 这个计划可靠吗? - 对抗性审查

何时激活

当用户出现以下情况时激活此技能:
  • - 说出上述任意触发词
  • 分享计划并要求进行对抗性/第二意见审查
  • 要求你对多步骤实施计划进行合理性检查

不适用于:简单修复、单行代码、纯研究任务。



模式

静态模式(v1 — 向后兼容)

固定角色:规划者始终编写,审查者始终审查。需要人工触发每轮。

交替模式(v2 — 推荐)

模型每轮互换角色。完全自主——轮次之间无需人工输入。

流程:

  • - 第1轮:模型A编写计划。模型B审查。
  • 第2轮:模型B重写(基于自身审查意见)。模型A审查。
  • 第3轮:模型A重写(基于自身审查意见)。模型B审查。
  • ...持续交替,直到双方达成一致(审查者说已批准)或达到最大轮次。

为何有效:

  • - 每个模型必须实施自己的批评——不能只挑毛病而不负责修复
  • 另一个模型能发现过度工程或比例失衡问题
  • 自然收敛:每轮解决另一方的关切点



自主编排(交替模式)

你(主代理)运行此循环。启动后完全自主。

步骤1 — 保存计划并初始化

bash
node review.js init \
--plan /path/to/plan.md \
--mode alternating \
--model-a anthropic/claude-opus-4-6 \
--model-b openai-codex/gpt-5.3-codex \
--project-context 供审查者校准的简要描述 \
--out /home/ubuntu/clawd/tasks/reviews

从标准输出捕获工作空间路径。

步骤2 — 自主循环

while true:
step = next-step(workspace)

if step.action == done:
break # 已批准!

if step.action == max-rounds:
询问用户:覆盖或手动修复
break

if step.action == review:
生成子代理,使用 step.model, step.prompt
将响应保存到 workspace/round-N-response.json
parse-round(workspace, round, response)
continue

if step.action == revise:
生成子代理,使用 step.model, step.prompt
将输出计划保存到临时文件
save-plan(workspace, temp file, version)
continue

步骤3 — 完成

当循环以已批准退出时:
bash
node review.js finalize --workspace

展示:进行的轮次、发现/解决的问题、评分标准得分、plan-final.md位置。



CLI参考

命令:
init 创建审查工作空间
next-step 获取自主循环的下一个操作
parse-round 解析审查者响应,更新问题追踪器
save-plan 保存编写者输出的修订计划版本
finalize 生成plan-final.md、changelog.md、summary.json
status 打印当前工作空间状态

init选项:
--plan 计划文件路径(必需)
--mode static(默认)或alternating
--model-a 模型A — 首先编写(交替模式,必需)
--model-b 模型B — 首先审查(交替模式,必需)
--reviewer-model 审查者模型(静态模式,必需)
--planner-model 规划者模型(静态模式,必需)
--project-context 供审查者校准的简要项目背景
--out

输出基础目录(默认:tasks/reviews)
--max-rounds 最大轮次(默认:静态5,交替8)
--token-budget 上下文令牌预算(默认:8000)

next-step选项:
--workspace

审查工作空间路径(必需)
返回JSON:{ action, model, round, prompt, planVersion, saveTo }
操作:review、revise、done、max-rounds

parse-round选项:
--workspace

审查工作空间路径(必需)
--round 轮次编号(必需)
--response 原始审查者响应文件路径(必需)

save-plan选项:
--workspace

审查工作空间路径(必需)
--plan 修订计划markdown文件路径(必需)
--version 计划版本号(必需)

finalize选项:
--workspace

审查工作空间路径(必需)
--override-reason 存在未解决问题时强制批准的原因
--ci-force 在非TTY模式下覆盖时需要

status选项:
--workspace

审查工作空间路径(必需)

退出码:
0 已批准/正常
1 修订/达到最大轮次
2 错误



详细编排(供代理实现)

生成审查者

step = next-step(workspace) # action: review
response = sessions_spawn(model=step.model, task=step.prompt, timeout=120s)

将原始响应保存到 workspace/round-{step.round}-response.json


parse-round(workspace, step.round, response_file)

审查者系统指令:你是高级工程审查者。仅输出符合模式的合法JSON。无工具调用。无markdown围栏。无前言。

生成编写者

step = next-step(workspace) # action: revise
revisedplan = sessionsspawn(model=step.model, task=step.prompt, timeout=300s)

将原始输出保存为临时文件


save-plan(workspace, temp_file, step.planVersion)

编写者系统指令:无需——提示本身已自包含。

错误处理

  • - 审查者超时/失败:重试一次,然后询问用户
  • 编写者超时/失败:重试一次,然后询问用户
  • 审查JSON解析错误:重新提示审查者一次,提示您的响应不是合法JSON
  • 达到最大轮次:向用户展示状态,询问覆盖或手动修复

收敛

当审查者说已批准且没有未解决的严重/高优先级阻塞项时,循环收敛。脚本强制执行此规则——如果审查者说已批准但仍有阻塞项,则覆盖为修订。

静态模式(v1 — 向后兼容)

对于静态模式,v1的原始编排仍然有效:

步骤1 — 初始化

bash node review.js init --plan --reviewer-model --planner-model

步骤2 — 手动循环

每轮:从模板构建审查者提示,生成审查者,解析轮次,自行修订计划,继续。

步骤3 — 完成

与交替模式相同。

与编码代理的集成

在将任何计划分派给编码代理之前,如果该计划:

  • - 涉及认证、支付或数据模型
  • 有3个以上实施步骤
  • 用户尚未进行对抗性审查

先运行跨模型审查。仅在退出码为0时才继续。



备注


  • - 工作空间持久化在 tasks/reviews/ 中——可后续引用
  • issues.json 追踪所有问题的完整生命周期
  • meta.json 存储模式、模型、当前轮次、裁决、是否需要修订标志
  • next-step 是状态机——始终调用它以确定下一步操作
  • 去重警告有助于捕捉跨轮次的语义漂移
  • 模型必须来自不同的提供商家族(跨提供商强制执行)
  • --project-context 被注入到审查者提示中以供校准

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 cross-model-review-1776419989 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 cross-model-review-1776419989 技能

通过命令行安装

skillhub install cross-model-review-1776419989

下载

⬇ 下载 cross-model-review v2.1.0(免费)

文件大小: 36.37 KB | 发布时间: 2026-4-17 19:05

v2.1.0 最新 2026-4-17 19:05
Round 0 criteria negotiation: Model A proposes 5 task-specific acceptance criteria, Model B challenges/refines. Agreed criteria injected into all reviewer prompts. New command: save-criteria. Backward compatible.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large