Adaptive Reasoning Plus — 自适应推理引擎
核心理念
不是所有问题都需要深度思考。
- - 简单指令 → 直接执行,不废话
- 复杂问题 → 停下来想清楚再说
复杂度评分量表
收到任务时,扫描六个信号,累加计分:
| 信号 | 权重 | 触发条件 |
|---|
| 多步逻辑 | +3 | 需要多步规划/执行、调试链路、证明链、因果分析 |
| 歧义性 |
+2 | 利弊权衡、"取决于"类问题、无标准答案 |
|
形式推理 | +2 | 数学计算、算法设计、逻辑推导、形式证明 |
|
新奇程度 | +1 | 首次遇到、无清晰先例、需要创造力 |
|
影响范围 | +1 | 涉及多个系统/模块/团队 |
|
不可逆性 | +2 | 不可逆操作、涉及真实资产/生产环境 |
⚠️ Tier-Override 规则:无论总分多少,不可逆性触发时自动升为8+强制推理。
推理策略(按分数段)
| 分数 | 策略 | 行动 |
|---|
| 0-2 | ⚡ 快速执行 | 直接响应,不做深度分析 |
| 3-5 |
🎯 标准处理 | 正常流程,适当思考后回答 |
|
6-7 | 🤔 深度思考 | 启用推理模式,多角度分析 |
|
8+ | 🧠 强制推理 | 开启 extended thinking,结构化输出 |
决策流程
CODEBLOCK0
推理激活标注
当评分 ≥ 6 时,在回复中明确标注:
6-7 分(深度思考):
CODEBLOCK1
8+ 分(强制推理):
🧠 复杂度:X分 [信号A+3, 信号B+2 ...]
→ 策略:强制推理,已启用 extended thinking
[结构化分析...
维度一:...
维度二:...
维度三:...]
---
[正式回复]
适用场景
应该激活此技能时:
- - 任务涉及多步规划或复杂决策
- 问题定义模糊,需要澄清或权衡
- 首次遇到的问题类型
- 不可逆操作前的分析
- 涉及多个系统/团队/业务线
不需要激活时:
- - 简单查询或明确指令("查天气"、"发消息")
- 纯执行类任务("运行这个脚本")
- 闲聊或无需分析的问题
- 2分以下的简单操作
领域扩展
详见 INLINECODE0
各领域增补信号示例:
- - 金融/投资:本金亏损风险、流动性风险、监管政策变化
- 技术/运维:生产环境变更、数据迁移、安全漏洞
- 法务/合同:法律风险、合规违规
- 电商/运营:客诉风险、库存风险、资金冻结
落地验证标准
| 测试 | 输入 | 预期 |
|---|
| Test 1 | "帮我查天气" | 0分 → ⚡快速,不废话 |
| Test 2 |
"这个文件删了" | 2分 → ⚡直接执行 |
| Test 3 | "帮我分析下这三个股票" | 6-7分 → 🤔深度思考 |
| Test 4 | "设计一个分布式系统架构" | 8+分 → 🧠强制推理+结构化 |
设计原则
- 1. 通用优先 — 框架适用于所有任务类型和领域
- 可扩展 — 各领域可在通用框架上增补自己的信号
- 可量化 — 评分有明确标准,避免主观随意
- 显式标注 — 推理决策透明可见
Adaptive Reasoning Plus — 自适应推理引擎
核心理念
不是所有问题都需要深度思考。
- - 简单指令 → 直接执行,不废话
- 复杂问题 → 停下来想清楚再说
复杂度评分量表
收到任务时,扫描六个信号,累加计分:
| 信号 | 权重 | 触发条件 |
|---|
| 多步逻辑 | +3 | 需要多步规划/执行、调试链路、证明链、因果分析 |
| 歧义性 |
+2 | 利弊权衡、取决于类问题、无标准答案 |
|
形式推理 | +2 | 数学计算、算法设计、逻辑推导、形式证明 |
|
新奇程度 | +1 | 首次遇到、无清晰先例、需要创造力 |
|
影响范围 | +1 | 涉及多个系统/模块/团队 |
|
不可逆性 | +2 | 不可逆操作、涉及真实资产/生产环境 |
⚠️ Tier-Override 规则:无论总分多少,不可逆性触发时自动升为8+强制推理。
推理策略(按分数段)
| 分数 | 策略 | 行动 |
|---|
| 0-2 | ⚡ 快速执行 | 直接响应,不做深度分析 |
| 3-5 |
🎯 标准处理 | 正常流程,适当思考后回答 |
|
6-7 | 🤔 深度思考 | 启用推理模式,多角度分析 |
|
8+ | 🧠 强制推理 | 开启 extended thinking,结构化输出 |
决策流程
收到任务
↓
扫描六个信号 → 累加评分
↓
总分判定 → 选择对应策略
↓
执行 → 必要时在末尾附图标
推理激活标注
当评分 ≥ 6 时,在回复中明确标注:
6-7 分(深度思考):
🤔 复杂度:X分 [信号A+3, 信号B+2 ...]
→ 策略:深度思考
[分析过程...]
[正式回复]
8+ 分(强制推理):
🧠 复杂度:X分 [信号A+3, 信号B+2 ...]
→ 策略:强制推理,已启用 extended thinking
[结构化分析...
维度一:...
维度二:...
维度三:...]
[正式回复]
适用场景
应该激活此技能时:
- - 任务涉及多步规划或复杂决策
- 问题定义模糊,需要澄清或权衡
- 首次遇到的问题类型
- 不可逆操作前的分析
- 涉及多个系统/团队/业务线
不需要激活时:
- - 简单查询或明确指令(查天气、发消息)
- 纯执行类任务(运行这个脚本)
- 闲聊或无需分析的问题
- 2分以下的简单操作
领域扩展
详见 references/domain-scoring.md
各领域增补信号示例:
- - 金融/投资:本金亏损风险、流动性风险、监管政策变化
- 技术/运维:生产环境变更、数据迁移、安全漏洞
- 法务/合同:法律风险、合规违规
- 电商/运营:客诉风险、库存风险、资金冻结
落地验证标准
| 测试 | 输入 | 预期 |
|---|
| Test 1 | 帮我查天气 | 0分 → ⚡快速,不废话 |
| Test 2 |
这个文件删了 | 2分 → ⚡直接执行 |
| Test 3 | 帮我分析下这三个股票 | 6-7分 → 🤔深度思考 |
| Test 4 | 设计一个分布式系统架构 | 8+分 → 🧠强制推理+结构化 |
设计原则
- 1. 通用优先 — 框架适用于所有任务类型和领域
- 可扩展 — 各领域可在通用框架上增补自己的信号
- 可量化 — 评分有明确标准,避免主观随意
- 显式标注 — 推理决策透明可见