Token Cost Monitor
Monitor OpenClaw API costs in real-time, set budget alerts, and optimize model spending.
Why This Matters
Real user stories:
- - One user spent $18.75 overnight on heartbeat checks asking "Is it daytime yet?"
- Federico Viticci spent $3,600 in a single month
- Regular users report $200/day bills from misconfigured automations
Quick Commands
Check current session costs:
CODEBLOCK0
Set up cost alerts:
CODEBLOCK1
Cost Optimization Strategies
1. Model Routing
Use cheaper models for simple tasks:
- - Claude Haiku: $0.25/1M input tokens (fast, cheap)
- Claude Sonnet: $3/1M input tokens (balanced)
- Claude Opus: $15/1M input tokens (expensive, powerful)
Routing rules:
CODEBLOCK2
2. Context Management
Reduce token waste:
- - Clear old conversation context regularly
- Don't store tool outputs in context
- Use concise system prompts
- Limit heartbeat frequency
3. Heartbeat Optimization
Common mistake:
CODEBLOCK3
Best practices:
- - Combine multiple checks into one heartbeat
- Use longer intervals (4-6 hours)
- Skip nighttime heartbeats (23:00-08:00)
- Track heartbeat costs separately
Cost Tracking Dashboard
Daily Cost Breakdown
| Category | Tokens | Cost |
|---|
| Heartbeat checks | 50,000 | $0.50 |
| Web searches |
100,000 | $1.00 |
| Code generation | 200,000 | $2.00 |
| Document analysis | 150,000 | $1.50 |
|
Total |
500,000 |
$5.00/day |
Monthly Projection
CODEBLOCK4
Budget Alerts Setup
Tier 1: Light User ($10-30/month)
CODEBLOCK5
Tier 2: Regular User ($40-80/month)
CODEBLOCK6
Tier 3: Power User ($100-500/month)
CODEBLOCK7
Cost Reduction Checklist
Immediate Actions (save 30-50%)
- - [ ] Reduce heartbeat frequency to 4-6 hours
- [ ] Route simple queries to Haiku
- [ ] Clear context after completed tasks
- [ ] Disable unnecessary automations
Medium-term (save 50-70%)
- - [ ] Implement model routing rules
- [ ] Optimize system prompts
- [ ] Batch similar tasks together
- [ ] Use caching for repeated queries
Long-term (save 70-90%)
- - [ ] Build cost-aware agent behaviors
- [ ] Implement token budgets per task
- [ ] Use local models for simple tasks
- [ ] Optimize tool output storage
Monitoring Commands
Real-time Cost Check
CODEBLOCK8
Historical Analysis
CODEBLOCK9
Anomaly Detection
CODEBLOCK10
Integration Examples
Slack/Discord Alerts
CODEBLOCK11
Email Reports
CODEBLOCK12
Cost Optimization Scripts
Auto-pause Expensive Sessions
CODEBLOCK13
Model Router
CODEBLOCK14
Common Cost Pitfalls
❌ Mistake: Infinite Loops
Agent keeps calling itself → 1000s of API calls → $100+ in hours
Fix: Implement loop detection and limits
❌ Mistake: Storing Tool Outputs
Every tool output saved to context → Context grows → Each call costs more
Fix: Only store essential information
❌ Mistake: Wrong Model for Task
Using Opus for weather queries → 60x more expensive than needed
Fix: Implement model routing
❌ Mistake: Heartbeat Misconfiguration
Heartbeat every 5 minutes → 288 calls/day → $50+/day
Fix: Use 4-6 hour intervals
Pricing Reference (2026)
Anthropic Claude
| Model | Input | Output | Best For |
|---|
| Haiku | $0.25/1M | $1.25/1M | Simple queries, facts |
| Sonnet |
$3/1M | $15/1M | General tasks |
| Opus | $15/1M | $75/1M | Complex analysis |
OpenAI GPT
| Model | Input | Output | Best For |
|---|
| GPT-4o Mini | $0.15/1M | $0.60/1M | Simple queries |
| GPT-4o |
$2.5/1M | $10/1M | General tasks |
| o1 | $15/1M | $60/1M | Complex reasoning |
Google Gemini
| Model | Input | Output | Best For |
|---|
| Flash | $0.075/1M | $0.30/1M | Simple queries |
| Pro |
$1.25/1M | $5/1M | General tasks |
| Ultra | $7.5/1M | $30/1M | Complex analysis |
ROI Calculator
Calculate if automation is worth it:
CODEBLOCK19
Updates
- - 2026-03-27: Initial release
- Pricing as of March 2026
- Based on real user cost data
Token 成本监控
实时监控 OpenClaw API 成本,设置预算警报,优化模型支出。
为何重要
真实用户案例:
- - 一位用户因心跳检测询问现在是白天吗?一夜花费 18.75 美元
- Federico Viticci 单月花费 3,600 美元
- 普通用户因自动化配置错误每天账单达 200 美元
快速命令
检查当前会话成本:
bash
查看 Token 使用量和预估成本
openclaw /status
openclaw /usage
设置成本警报:
bash
当日支出超过 10 美元时警报
echo 如果 daily_cost > $10 则警报
当月支出超过 100 美元时警报
echo 如果 monthly_cost > $100 则警报
成本优化策略
1. 模型路由
简单任务使用更便宜的模型:
- - Claude Haiku:每百万输入 Token 0.25 美元(快速、便宜)
- Claude Sonnet:每百万输入 Token 3 美元(均衡)
- Claude Opus:每百万输入 Token 15 美元(昂贵、强大)
路由规则:
简单查询(天气、事实)→ Haiku
复杂分析 → Sonnet
创意写作 → Opus(仅在需要时)
2. 上下文管理
减少 Token 浪费:
- - 定期清理旧对话上下文
- 不在上下文中存储工具输出
- 使用简洁的系统提示
- 限制心跳频率
3. 心跳优化
常见错误:
❌ 每 30 分钟:现在是白天吗? → 每晚 18.75 美元
✅ 每 6 小时:检查邮件 + 日历 → 每天 2 美元
最佳实践:
- - 将多次检查合并为一次心跳
- 使用较长间隔(4-6 小时)
- 跳过夜间心跳(23:00-08:00)
- 单独跟踪心跳成本
成本跟踪仪表盘
每日成本明细
| 类别 | Token 数 | 成本 |
|---|
| 心跳检查 | 50,000 | 0.50 美元 |
| 网页搜索 |
100,000 | 1.00 美元 |
| 代码生成 | 200,000 | 2.00 美元 |
| 文档分析 | 150,000 | 1.50 美元 |
|
总计 |
500,000 |
每天 5.00 美元 |
月度预测
日均:5.00 美元
月度预测:150.00 美元
预算限制:100.00 美元
⚠️ 警告:将超出预算 50 美元
预算警报设置
第一级:轻度用户(每月 10-30 美元)
每日限制:1.00 美元
警报阈值:每天 0.80 美元
措施:降低心跳频率,更多使用 Haiku
第二级:普通用户(每月 40-80 美元)
每日限制:2.50 美元
警报阈值:每天 2.00 美元
措施:优化上下文,审查模型路由
第三级:重度用户(每月 100-500 美元)
每日限制:10.00 美元
警报阈值:每天 8.00 美元
措施:审计所有自动化,实施严格路由
成本降低清单
立即行动(节省 30-50%)
- - [ ] 将心跳频率降低至 4-6 小时
- [ ] 将简单查询路由至 Haiku
- [ ] 完成任务后清除上下文
- [ ] 禁用不必要的自动化
中期行动(节省 50-70%)
- - [ ] 实施模型路由规则
- [ ] 优化系统提示
- [ ] 批量处理相似任务
- [ ] 对重复查询使用缓存
长期行动(节省 70-90%)
- - [ ] 构建成本感知的智能体行为
- [ ] 为每个任务实施 Token 预算
- [ ] 简单任务使用本地模型
- [ ] 优化工具输出存储
监控命令
实时成本检查
bash
获取当前会话统计
openclaw /status
获取详细使用情况明细
openclaw /usage --detailed
历史分析
bash
过去 7 天成本趋势
echo 分析过去 7 天的支出趋势
识别最昂贵的任务
echo 我花费最高的 5 种任务类型是什么?
异常检测
bash
如果支出是正常值的 2 倍则警报
echo 如果 hourly
cost > 2 * averagehourly_cost 则警报
集成示例
Slack/Discord 警报
bash
向 Slack 发送每日成本摘要
curl -X POST https://hooks.slack.com/services/YOUR/WEBHOOK/URL \
-d {text: 每日 OpenClaw 成本:5.00 美元(预算:10.00 美元)}
邮件报告
bash
通过邮件发送每周成本报告
echo 每周成本报告:总计 35.00 美元,日均 5.00 美元 | mail -s OpenClaw 成本报告 user@example.com
成本优化脚本
自动暂停昂贵会话
bash
#!/bin/bash
如果每日成本超过限制则暂停会话
DAILY_LIMIT=10
CURRENTCOST=$(getcurrent_cost)
if (( $(echo $CURRENTCOST > $DAILYLIMIT | bc -l) )); then
echo ⚠️ 每日成本($CURRENTCOST)超过限制($DAILYLIMIT)
echo 暂停非必要自动化...
# 在此添加暂停逻辑
fi
模型路由器
bash
#!/bin/bash
根据复杂度将查询路由至适当模型
QUERY=$1
WORD_COUNT=$(echo $QUERY | wc -w)
if [ $WORD_COUNT -lt 20 ]; then
echo 使用 Haiku(简单查询)
MODEL=haiku
elif [ $WORD_COUNT -lt 100 ]; then
echo 使用 Sonnet(中等复杂度)
MODEL=sonnet
else
echo 使用 Opus(复杂分析)
MODEL=opus
fi
常见成本陷阱
❌ 错误:无限循环
智能体不断调用自身 → 数千次 API 调用 → 数小时内超过 100 美元
修复: 实施循环检测和限制
❌ 错误:存储工具输出
每个工具输出都保存到上下文 → 上下文增长 → 每次调用成本增加
修复: 仅存储必要信息
❌ 错误:任务使用错误模型
使用 Opus 进行天气查询 → 比所需贵 60 倍
修复: 实施模型路由
❌ 错误:心跳配置错误
每 5 分钟心跳一次 → 每天 288 次调用 → 每天 50 美元以上
修复: 使用 4-6 小时间隔
定价参考(2026)
Anthropic Claude
| 模型 | 输入 | 输出 | 最佳用途 |
|---|
| Haiku | 每百万 0.25 美元 | 每百万 1.25 美元 | 简单查询、事实 |
| Sonnet |
每百万 3 美元 | 每百万 15 美元 | 一般任务 |
| Opus | 每百万 15 美元 | 每百万 75 美元 | 复杂分析 |
OpenAI GPT
| 模型 | 输入 | 输出 | 最佳用途 |
|---|
| GPT-4o Mini | 每百万 0.15 美元 | 每百万 0.60 美元 | 简单查询 |
| GPT-4o |
每百万 2.5 美元 | 每百万 10 美元 | 一般任务 |
| o1 | 每百万 15 美元 | 每百万 60 美元 | 复杂推理 |
Google Gemini
| 模型 | 输入 | 输出 | 最佳用途 |
|---|
| Flash | 每百万 0.075 美元 | 每百万 0.30 美元 | 简单查询 |
| Pro |
每百万 1.25 美元 | 每百万 5 美元 | 一般任务 |
| Ultra | 每百万 7.5 美元 | 每百万 30 美元 | 复杂分析 |
ROI 计算器
计算自动化是否值得:
手动任务时间:30 分钟
您的时薪:50 美元/小时
手动成本:每任务 25 美元
自动化成本: