返回顶部
p

production-model-router生产模型路由

Route each user request to the most cost-effective model or multi-model workflow based on task type, complexity, risk, latency, budget, tool needs, and verification requirements.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2026.3.27
安全检测
已通过
150
下载量
免费
免费
2
收藏
概述
安装方式
版本历史

production-model-router

生产模型路由器

概述

使用此技能来决定应使用哪个模型层级、工作流形态和验证策略来处理用户的请求。

目标是最大化成本效益,同时不牺牲任务适配性、正确性或运营可靠性。

此技能不会盲目选择最强的模型。它会选择最便宜的、仍能满足任务质量标准的可行路径。

它可能推荐:

  • - 单个低成本模型
  • 单个均衡模型
  • 单个高级模型
  • 工具辅助模型工作流
  • 分阶段多模型流水线
  • 并行比较工作流
  • 草稿与审查工作流
  • 共识或验证器工作流

主要目标

对于每个请求,选择能够满足以下条件的最低成本执行路径:
  • - 任务质量
  • 正确性要求
  • 延迟预期
  • 安全或风险约束
  • 输出格式需求
  • 工具和模态要求

何时使用

当需要决定以下事项时使用此技能:
  • - 哪个模型应回答给定的用户请求
  • 低成本模型是否足够
  • 何时升级到更强的推理模型
  • 何时使用单个模型与多个模型
  • 何时使用工具而非依赖纯模型推理
  • 如何处理复杂计算、代码、多模态输入、长上下文或高风险任务
  • 如何平衡生产环境中的成本、速度和回答质量

不要使用

不要使用此技能来:
  • - 直接回答原始业务问题
  • 在没有环境或配置证据的情况下虚构模型能力
  • 假设最昂贵的模型总是最佳选择
  • 在没有验证的情况下将高风险精确任务路由到低成本模型
  • 在工具可用时依赖纯语言生成进行精确算术

需要收集的输入

从请求和系统上下文中收集或推断以下信息:

请求特征

  • - 任务类型
  • 领域
  • 预期输出类型
  • 是否存在图像、文件、表格、代码或长文档
  • 对精确性与近似有用性的需求
  • 请求是开放式的还是精度关键的

执行约束

  • - 预算敏感度
  • 延迟敏感度
  • 质量预期
  • Token或上下文大小压力
  • 工具可用性
  • 是否需要引用或可追溯性
  • 是否需要可复现性

风险概况

  • - 低风险
  • 中风险
  • 高风险

容错能力

  • - 粗略答案是否可接受
  • 答案是否必须经过验证
  • 模型之间的分歧是否有价值

任务分类

将请求归类为以下一个或多个类别:
  1. 1. 简单生成
- 重写 - 摘要 - 格式化 - 轻度翻译 - 基础头脑风暴
  1. 2. 一般推理
- 解释 - 比较 - 概念映射 - 常规业务分析
  1. 3. 深度推理
- 多步骤规划 - 权衡分析 - 架构设计 - 模糊决策支持 - 链式依赖推理
  1. 4. 精确计算或形式逻辑
- 算术 - 财务计算 - 单位换算 - 类电子表格推理 - 符号或步骤敏感的数学 - 精确性重要的组合或逻辑谜题
  1. 5. 编码和技术执行
- 代码生成 - 调试 - 重构 - 测试生成 - 查询编写 - 基础设施或API设计
  1. 6. 长上下文综合
- 大型文档 - 多个文件 - 多源比较 - 转录或合同审查
  1. 7. 多模态任务
- 图像理解 - 图表解读 - 布局密集的PDF - 视频或音频相关任务(如支持)
  1. 8. 高风险任务
- 医疗 - 法律 - 财务决策 - 合规 - 安全敏感操作 - 任何错误建议会产生重大后果的事项

核心路由原则

始终优先选择能够安全成功的最便宜路径。

按以下优先级顺序应用:

  1. 1. 低成本单模型路径
  2. 均衡单模型路径
  3. 高级单模型路径
  4. 工具辅助路径
  5. 分阶段多模型路径
  6. 并行多模型比较
  7. 高级加验证器或共识工作流

除非任务特征证明有必要,否则不要升级。

模型层级

除非部署指定了具体的提供商,否则使用抽象能力层级。

经济层

用于:
  • - 简单重写
  • 格式化
  • 低风险分类
  • 简短摘要
  • 轻量提取
  • 初筛分类

优势:

  • - 最低成本
  • 快速响应
  • 适合直接任务

劣势:

  • - 深度推理较弱
  • 对模糊性更脆弱
  • 在精确性关键任务上表现较差

均衡层

用于:
  • - 日常产品和工程工作
  • 标准推理
  • 中等代码任务
  • 中等文档分析
  • 大多数业务和写作任务

优势:

  • - 良好的质量-成本权衡
  • 处理大多数正常生产流量
  • 合理的速度和鲁棒性

劣势:

  • - 在高度模糊或要求严格的任务上仍可能失败
  • 对于困难推理或高风险请求不一定足够

高级层

用于:
  • - 深度推理
  • 困难的代码和架构问题
  • 具有微妙依赖关系的长上下文综合
  • 高价值输出
  • 需要更强判断力的高风险任务

优势:

  • - 最强推理能力
  • 更好的模糊处理能力
  • 更好的综合质量

劣势:

  • - 最高成本
  • 通常较慢
  • 对于简单任务过度

工具辅助层

当精确性比流畅措辞更重要时使用。

用于以下路径:

  • - 算术
  • 确定性计算
  • 电子表格操作
  • 公式应用
  • 结构化数据转换
  • 精确代码执行或测试(如可用)
  • 基于检索的事实性任务

规则:
当任务需要精确数值正确性时,优先选择工具加模型编排而非纯模型推理。

决策维度

在以下维度上对请求进行评分:

1. 复杂度

  • - 低
  • 非常高

2. 精确性要求

  • - 低:近似答案可接受
  • 中:基本正确可接受
  • 高:预期精确结果
  • 关键:需要精确结果加验证

3. 风险等级

  • - 低

4. 延迟优先级

  • - 紧急
  • 正常
  • 宽松

5. 预算策略

  • - 最小化成本
  • 均衡
  • 质量优先

6. 上下文负担

  • - 短
  • 中等
  • 极长

7. 模态负担

  • - 仅文本
  • 图像或PDF
  • 混合输入

硬路由规则

在任何软优化之前应用这些规则。

精确计算规则

如果任务涉及精确算术、公式、表格、类会计操作、单位敏感转换或步骤敏感逻辑:
  • - 在工具可用时不要依赖纯语言路径
  • 优先选择工具辅助执行
  • 仅使用均衡或高级模型来解释任务和说明结果
  • 对高影响数值输出添加验证步骤

高风险规则

如果任务属于高风险:
  • - 不要将经济层单独路由作为最终路径
  • 需要高级单模型推理加接地或模型加验证器工作流
  • 尽可能添加引用、检查或审查环节

模糊性规则

如果任务存在实质性模糊且答案质量取决于解读:
  • - 使用更强的推理层或两阶段工作流
  • 在没有澄清或审查的情况下不要以低成本的初筛答案作为最终结果

长上下文规则

如果输入较大或多文档:
  • - 优先选择分阶段处理
  • 先进行提取或分块摘要
  • 然后根据需要,使用更强的模型进行综合
  • 如果分阶段缩减更便宜且安全,避免默认将所有内容发送给最强模型

多模态规则

如果任务包含图像、图表、依赖布局的PDF或视觉解读:
  • - 使用实际支持所需模态的模型路径
  • 不要路由到仅文本路径

编码规则

对于代码任务:
  • - 简单的样板代码或语法转换可使用均衡或经济层
  • 调试、架构、并发、性能或棘手的重构应升级到均衡或高级层
  • 如果执行、代码检查、测试或静态分析工具可用,优先选择工具辅助验证

推荐工作流

选择以下工作流形态之一。

1. 单经济层

在以下情况下使用:
  • - 低复杂度
  • 低风险
  • 低精确性要求
  • 低业务影响
  • 延迟和成本比精细度更重要

示例:

  • - 重写文本
  • 生成简短摘要
  • 分类意图
  • 格式化内容

2. 单均衡层

在以下情况下使用:
  • - 任务是典型的生产流量
  • 需要中等推理
  • 质量重要但高级层不合理

示例:

  • - 标准技术问答
  • 普通产品文案
  • 中等

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 model-routing-orchestrator-1776005702 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 model-routing-orchestrator-1776005702 技能

通过命令行安装

skillhub install model-routing-orchestrator-1776005702

下载

⬇ 下载 production-model-router v2026.3.27(免费)

文件大小: 7.23 KB | 发布时间: 2026-4-13 11:05

v2026.3.27 最新 2026-4-13 11:05
No user-visible changes. Version bumped from 2026.3.26 to 2026.3.27 with no file or documentation updates.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部