动态评审团多维评分系统

基于 AutoResearch 思路的智能评审框架。

核心理念

CODEBLOCK0

工作流程

Phase 1: 任务分析

分析用户任务，识别关键维度：

CODEBLOCK1

Phase 2: 生成核心评审团

根据任务类型，生成"上下左右"包围阵势的核心评审团：

CODEBLOCK2

核心评审团生成规则：

任务类型	核心评审团	说明
网络服务	架构官、安全官、性能官、测试官	四方包围
数据处理

Phase 3: 极端评审团挑战

生成"极端评审官"，质疑核心评审团的盲点：

极端评审官类型：

极端评审官	职责	挑战问题
🔥 纵火官	破坏性测试	"如果故意传入恶意输入会怎样？"
🧟 僵尸官

Phase 4: 用户选择

向用户展示极端评审团，选择加入：

CODEBLOCK3

Phase 5: 终极评审团

组合核心 + 极端，形成本次任务的终极评审团：

CODEBLOCK4
【架构官】赵构
↓
【安全官】盾山 ─── 代码 ─── 【性能官】闪电
↑
【测试官】试金石


### 极端挑战

🔥 纵火官·焚天 | 🌀 混沌官·乱舞 | 🌪️ 风暴官·狂啸
CODEBLOCK6

Phase 6: 多轮迭代

CODEBLOCK7

评审官角色库

核心评审官

评审官	符号	维度	权重范围
🎨 美术官	🎨	代码美学	10-25%
⚡ 性能官

⚡ | 执行效率 | 10-25% | | 🔒 安全官 | 🔒 | 安全性 | 10-25% | | 🧪 测试官 | 🧪 | 测试质量 | 10-25% | | 📝 文档官 | 📝 | 文档完整 | 10-25% | | 🏗️ 架构官 | 🏗️ | 架构设计 | 10-20% | | 📊 数据官 | 📊 | 数据处理 | 10-20% | | 👁️ 体验官 | 👁️ | 用户体验 | 10-20% | | ⚖️ 合规官 | ⚖️ | 合规性 | 10-20% | | 🤖 算法官 | 🤖 | 算法质量 | 10-20% |

极端评审官

评审官	符号	挑战类型	适用场景
🔥 纵火官	🔥	破坏性测试	网络、安全、输入处理
🧟 僵尸官

🧟 | 资源极限 | 嵌入式、移动端 | | ⏰ 时间官 | ⏰ | 时间压力 | 实时系统、高频交易 | | 💀 死神官 | 💀 | 失败恢复 | 关键系统、金融 | | 🎭 骗子官 | 🎭 | 输入欺骗 | 用户输入、API | | 🌀 混沌官 | 🌀 | 随机异常 | 分布式、网络 | | 📉 吝啬官 | 📉 | 资源极限 | 性能敏感 | | 🌪️ 风暴官 | 🌪️ | 极限负载 | 高并发、游戏 |

配置参数

参数	默认值	说明
INLINECODE0	5	最大迭代次数
INLINECODE1

使用示例

示例 1: 高并发服务器

CODEBLOCK8

示例 2: 数据处理脚本

CODEBLOCK9

反馈输出格式

CODEBLOCK10

注意事项

- 极端评审官数量适中，避免过度惩罚
每轮迭代要有明确改进目标
迭代停滞时及时终止
记录评审历史用于分析优化

动态评审团多维评分系统

基于 AutoResearch 思路的智能评审框架。

核心理念

任务分析 → 生成评审团 → 极端挑战 → 用户选择 → 终极评审团 → 迭代优化

工作流程

Phase 1: 任务分析

分析用户任务，识别关键维度：

python
task = 创建一个高并发的 C++ HTTP 服务器

analysis = {
type: 网络服务,
keywords: [高并发, HTTP, 服务器, C++],
risk_areas: [并发安全, 内存管理, 网络协议],
quality_focus: [性能, 安全, 稳定性]
}

Phase 2: 生成核心评审团

根据任务类型，生成上下左右包围阵势的核心评审团：

【上】架构官
↓
【左】安全官 ←─── 核心代码 ───→ 【右】性能官
↑
【下】测试官

核心评审团生成规则：

任务类型	核心评审团	说明
网络服务	架构官、安全官、性能官、测试官	四方包围
数据处理

Phase 3: 极端评审团挑战

生成极端评审官，质疑核心评审团的盲点：

极端评审官类型：

极端评审官	职责	挑战问题
🔥 纵火官	破坏性测试	如果故意传入恶意输入会怎样？
🧟 僵尸官

Phase 4: 用户选择

向用户展示极端评审团，选择加入：

markdown

🎭 极端评审官提议

根据您的任务特点，建议考虑以下极端评审官：

评审官	挑战维度	推荐理由
🔥 纵火官	破坏性测试	网络服务需要抵抗恶意输入
🌀 混沌官

请选择要加入的极端评审官：

- [ ] 全部加入
[ ] 选择加入（指定）
[ ] 不加入，使用核心评审团

Phase 5: 终极评审团

组合核心 + 极端，形成本次任务的终极评审团：

markdown

⚔️ 终极评审团阵容

核心阵势

【架构官】赵构
↓
【安全官】盾山 ─── 代码 ─── 【性能官】闪电
↑
【测试官】试金石

极端挑战

🔥 纵火官·焚天 | 🌀 混沌官·乱舞 | 🌪️ 风暴官·狂啸

共 7 位评审官，综合权重自动分配。

Phase 6: 多轮迭代

python
for iteration in range(max_iterations):
# 1. 生成/改进代码
code = generateorimprove(task, previous_feedback)

# 2. 核心评审团评分
corescores = corejury.evaluate(code)

# 3. 极端评审官挑战
extremechallenges = extremejury.challenge(code)

# 4. 综合得分
total = weightedaverage(corescores, extreme_challenges)

# 5. 决策
if total >= threshold:
return ACCEPT, code
elif no_improvement:
return STAGNANT, best_code
else:
feedback = generatefeedback(corescores, extreme_challenges)
continue

评审官角色库

核心评审官

评审官	符号	维度	权重范围
🎨 美术官	🎨	代码美学	10-25%
⚡ 性能官

极端评审官

评审官	符号	挑战类型	适用场景
🔥 纵火官	🔥	破坏性测试	网络、安全、输入处理
🧟 僵尸官

配置参数

参数	默认值	说明
maxiterations	5	最大迭代次数
acceptthreshold

使用示例

示例 1: 高并发服务器

用户: 创建一个高并发 C++ HTTP 服务器

系统分析:

- 类型: 网络服务
关键词: 高并发、HTTP、服务器
风险点: 并发安全、内存泄漏、连接管理

生成核心评审团:
【架构官】
↓
【安全官】─── 代码 ───【性能官】
↑
【测试官】

极端评审官提议:

- 🔥 纵火官 (恶意请求)
🌪️ 风暴官 (极限并发)
🌀 混沌官 (网络异常)

用户选择: 全部加入

终极评审团: 7 位评审官
开始多轮迭代...

示例 2: 数据处理脚本

用户: 写一个 Python 数据清洗脚本

系统分析:

- 类型: 数据处理
关键词: 数据、清洗、脚本

生成核心评审团:
【数据官】
↓
【安全官】─── 代码 ───【性能官】
↓
【文档官】

极端评审官提议:

- 🎭 骗子官 (脏数据)
💀 死神官 (数据丢失)

用户选择: 加入骗子官

终极评审团: 5 位评审官
开始多轮迭代...

反馈输出格式

markdown

⚔️ 第 N 轮评审

###

jury-review动态评审团

jury-review

动态评审团多维评分系统

核心理念

工作流程

Phase 1: 任务分析

Phase 2: 生成核心评审团

Phase 3: 极端评审团挑战

Phase 4: 用户选择

Phase 5: 终极评审团

Phase 6: 多轮迭代

评审官角色库

核心评审官

极端评审官

配置参数

使用示例

示例 1: 高并发服务器

示例 2: 数据处理脚本

反馈输出格式

注意事项

动态评审团多维评分系统

核心理念

工作流程

Phase 1: 任务分析

Phase 2: 生成核心评审团

Phase 3: 极端评审团挑战

Phase 4: 用户选择

🎭 极端评审官提议

Phase 5: 终极评审团

⚔️ 终极评审团阵容

核心阵势

极端挑战

Phase 6: 多轮迭代

评审官角色库

核心评审官

极端评审官

配置参数

使用示例

示例 1: 高并发服务器

示例 2: 数据处理脚本

反馈输出格式

⚔️ 第 N 轮评审

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement