Model Pilot v2.0
Install: INLINECODE0
Stop overpaying for intelligence. Match every task to the cheapest model that delivers the quality you need.
Language
Detect from user's message language. Default: English.
When to Activate
- - User explicitly asks about model choice or cost
- A task is starting that will be expensive (agent judgment — don't analyze trivial tasks)
- User says "save tokens", "cheaper model", "right model?"
Do NOT activate for trivial tasks — formatting, greetings, simple lookups.
Quick Complexity Check
Before an expensive task, ask yourself:
CODEBLOCK0
Tier Classification
| Tier | Tasks | Model |
|---|
| 🟢 Routine | Formatting, Q&A, reminders, greetings, file ops | Cheapest available |
| 🟡 Intermediate |
Email drafting, code review, data analysis, translations | Mid-tier |
| 🔴 Complex | Architecture decisions, creative writing, debugging complex issues | Best available |
Signal: Task needs <1000 output tokens + no creativity = Tier 1.
Live Pricing
Fetch current pricing when user asks about costs:
CODEBLOCK1
Do NOT hardcode prices — they change frequently. Always fetch live.
Cost Estimation
Quick formula:
CODEBLOCK2
Show to user:
CODEBLOCK3
Quick Commands
| User says | Action |
|---|
| "right model?" | Quick complexity check |
| "model cost" |
Cost estimate for current task |
| "compare models" | Live pricing comparison |
| "cheaper option" | Find cheaper model for same task |
Guidelines for Agent
- 1. Don't waste tokens analyzing cheap tasks — check only for expensive ones
- Use live pricing — never hardcode
- Be honest about quality — if cheaper means worse, say so
- Keep it quick — 5 seconds of thinking max
- Match user language
What This Skill Does NOT Do
- - Does NOT switch models automatically — recommends only
- Does NOT persist anything
- Does NOT access credentials
- Does NOT modify any files
More by TommoT2
- - cross-check — Auto-detect and verify assumptions in your responses
- context-brief — Persistent context survival across sessions
- setup-doctor — Diagnose and fix OpenClaw setup issues
Install the full suite:
CODEBLOCK4
Model Pilot v2.0
安装: clawhub install model-pilot
别再为智能能力过度付费。将每个任务匹配到能提供所需质量的最便宜模型。
语言
根据用户消息语言自动检测。默认:英语。
何时激活
- - 用户明确询问模型选择或成本
- 即将开始一个昂贵的任务(由智能体判断——不要分析琐碎任务)
- 用户说节省令牌、更便宜的模型、合适的模型?
不要为琐碎任务激活——如格式化、问候、简单查询。
快速复杂度检查
在开始昂贵任务前,问自己:
- 1. 任务是什么?(分类)
- 当前激活的是哪个模型?
- 更便宜的模型能否同样好地处理此任务?
- 如果能 → 推荐切换 + 预估节省
- 如果不能 → 继续执行,并解释原因
层级分类
| 层级 | 任务 | 模型 |
|---|
| 🟢 常规 | 格式化、问答、提醒、问候、文件操作 | 最便宜的可用模型 |
| 🟡 中级 |
邮件起草、代码审查、数据分析、翻译 | 中档模型 |
| 🔴 复杂 | 架构决策、创意写作、调试复杂问题 | 最佳可用模型 |
信号: 任务需要 <1000 个输出令牌 + 无需创意 = 第一层级。
实时定价
当用户询问成本时,获取当前定价:
web_fetch https://z.ai/pricing
web_search openai gpt-4o pricing per token
不要硬编码价格——它们经常变动。始终获取实时数据。
成本估算
快速公式:
预估成本 = (输入令牌数 / 1M × 输入价格) + (输出令牌数 / 1M × 输出价格)
向用户展示:
模型:GLM-5-Turbo
输入:~5K 令牌
输出:~2K 令牌
预估成本:~$0.002
可选用:GLM-4 (~$0.001) — 节省约50%
快速命令
当前任务的成本估算 |
| 比较模型 | 实时定价对比 |
| 更便宜的选择 | 为同一任务寻找更便宜的模型 |
智能体指南
- 1. 不要浪费令牌分析廉价任务——只检查昂贵任务
- 使用实时定价——绝不硬编码
- 对质量诚实——如果更便宜意味着更差,请如实告知
- 保持快速——最多思考5秒
- 匹配用户语言
此技能不做什么
- - 不会自动切换模型——仅提供建议
- 不会持久化任何内容
- 不会访问凭证
- 不会修改任何文件
TommoT2 的更多作品
- - cross-check — 自动检测并验证回复中的假设
- context-brief — 跨会话持久化上下文
- setup-doctor — 诊断并修复 OpenClaw 设置问题
安装完整套件:
bash
clawhub install model-pilot cross-check context-brief setup-doctor