返回顶部
p

proxy-token-optimizer代理令牌优化

|

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
188
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

proxy-token-optimizer

Proxy Token Optimizer

通过四种策略降低openclaw-manager多租户代理平台的LLM API成本:

  1. 1. 模型层级路由 — 将提示路由到最便宜且能胜任的模型
  2. 心跳优化 — 对心跳调用使用最便宜模型 + 更长间隔
  3. 上下文懒加载 — 仅加载每个提示实际需要的上下文文件
  4. 平台使用分析 — 基于PostgreSQL的真实数据,而非估算

这些策略为何重要

openclaw-manager平台通过zai-proxy、zai-coding-proxy和kimi-coding-proxy等提供商为多个OpenClaw实例代理LLM请求。每个提供商提供不同价位的模型(例如glm-4.7 vs glm-4.7-flashx)。未经优化时,每个请求——包括简单的问候和心跳ping——都使用默认(昂贵)模型,且每个会话无论是否需要都加载完整上下文。这四种策略针对影响最大的成本驱动因素。

快速开始

所有实例端脚本在本地运行,无依赖项。平台端脚本需要数据库访问。

bash

模型路由 — 哪个模型应处理此提示?


python3 scripts/model_router.py 谢谢!

→ {tier: cheap, recommended_model: zai-proxy/glm-4.7-flashx}

上下文优化 — 此提示需要哪些文件?

python3 scripts/context_optimizer.py recommend 你好

→ {contextlevel: minimal, recommendedfiles: [SOUL.md, IDENTITY.md]}

心跳配置 — 生成openclaw.json补丁

python3 scripts/heartbeat_config.py patch

→ {agents: {defaults: {heartbeat: {every: 55m, model: zai-proxy/glm-4.7-flashx}}}}

统一CLI(所有命令集中一处)

python3 scripts/cli.py --help

脚本参考

实例端(纯本地,无网络,无数据库)

scripts/model_router.py

基于复杂度分析将提示路由到正确的模型层级。

层级逻辑:

  • - cheap → glm-4.7-flashx:问候、确认、心跳、定时任务、日志解析。成本节省:相比标准模型5-10倍。
  • standard → glm-4.7:代码编写、调试、解释。不明确提示的默认选项。
  • premium → glm-4.7(或kimi的k2p5):架构设计、深度分析、策略规划。

支持中英文模式。可感知提供商——兼容zai-proxy、zai-coding-proxy和kimi-coding-proxy。

bash
python3 scripts/model_router.py <提示> [提供商]
python3 scripts/model_router.py compare # 显示所有提供商模型

scripts/context_optimizer.py

分析提示复杂度,推荐加载哪些上下文文件,减少不必要的token消耗。

上下文级别:

级别适用场景加载文件Token节省
minimal你好、谢谢、短消息SOUL.md + IDENTITY.md(2个)~80%
standard
写一个函数、正常工作 | + memory/TODAY.md + 条件性文件 | ~50% |
| full | 设计架构、复杂任务 | + MEMORY.md + 所有条件性文件 | ~30% |

同时生成内置懒加载规则的优化版AGENTS.md模板:

bash
python3 scripts/context_optimizer.py recommend <提示>
python3 scripts/context_optimizer.py generate-agents # 创建AGENTS.md.optimized

scripts/heartbeat_config.py

生成用于心跳优化的openclaw.json配置补丁:

  • - 强制心跳模型为glm-4.7-flashx(最便宜可用模型)
  • 设置间隔为55分钟(在1小时TTL内保持提示缓存温暖,避免缓存重建成本)

bash
python3 scripts/heartbeat_config.py recommend [缓存TTL分钟数]
python3 scripts/heartbeat_config.py patch # 输出openclaw.json的JSON补丁

平台端(需要数据库连接)

这些脚本查询usage_records PostgreSQL表获取真实数据。在openclaw-manager项目根目录下使用激活的虚拟环境运行。

scripts/usage_report.py

从实际数据库记录生成使用报告——而非估算。

bash
python3 scripts/usage_report.py overview [天数] # 平台级摘要
python3 scripts/usage_report.py instance <名称> [天数] # 单个实例详情

摘要包括: 总调用次数/token数、按提供商细分、按模型细分、消费前10实例、7天每日趋势。

实例报告包括: 按模型分布、每日趋势、生命周期总计。

scripts/quota_advisor.py

将实际24小时使用量与配额计划限制进行比较,发现不匹配:

  • - 浪费型: 使用量低于计划限制的20% → 建议降级
  • 受限型: 使用量超过计划限制的80% → 建议升级

bash
python3 scripts/quota_advisor.py analyze # 检查所有实例
python3 scripts/quota_advisor.py plans # 显示可用配额计划

统一CLI

scripts/cli.py将上述所有功能封装为单一入口点:

bash
python3 scripts/cli.py route <提示> # 模型路由
python3 scripts/cli.py context <提示> # 上下文推荐
python3 scripts/cli.py generate-agents # 生成AGENTS.md
python3 scripts/cli.py heartbeat # 心跳配置
python3 scripts/cli.py overview [天数] # 平台使用(需要数据库)
python3 scripts/cli.py report <名称> [天数] # 实例报告(需要数据库)
python3 scripts/cli.py advisor # 配额建议(需要数据库)

项目集成点

此技能与现有openclaw-manager基础设施配合使用:

组件文件此技能如何使用
提供商配置config/model.yaml用于路由的模型名称/端点
代理路由
configservice.py | injectproxyproviders()注册模型的位置 |
| 使用记录 | proxycommon/usagerecorder.py | 真实使用数据的来源 |
| 配额计划 | config/llm_proxy.yaml | 配额顾问的计划定义 |
| 实例模型 | app/models.py | 报告的实例元数据 |

预期节省

策略机制影响
上下文懒加载每次请求更少的token上下文减少50-80%
模型路由(flashx)
更低的每token价格 | 简单任务5-10倍 | | 心跳 → flashx | 更低的心跳成本 | 每个实例显著节省 | | 心跳间隔55分钟 | 更少的API调用 | 心跳调用减少约45% |

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 proxy-token-optimizer-1776188883 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 proxy-token-optimizer-1776188883 技能

通过命令行安装

skillhub install proxy-token-optimizer-1776188883

下载

⬇ 下载 proxy-token-optimizer v1.0.1(免费)

文件大小: 15.54 KB | 发布时间: 2026-4-17 15:50

v1.0.1 最新 2026-4-17 15:50
- Added SKILL metadata: now always active for openclaw-manager via `"openclaw": {"always": true}`.
- Included new project files: CHANGELOG.md, README.md, SECURITY.md, .clawhubsafe, and others.
- No functional changes to optimization logic or documentation content.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部