Token Cost Monitor

Monitor OpenClaw API costs in real-time, set budget alerts, and optimize model spending.

Why This Matters

Real user stories:

- One user spent $18.75 overnight on heartbeat checks asking "Is it daytime yet?"
Federico Viticci spent $3,600 in a single month
Regular users report $200/day bills from misconfigured automations

Quick Commands

Check current session costs:
CODEBLOCK0

Set up cost alerts:
CODEBLOCK1

Cost Optimization Strategies

1. Model Routing

Use cheaper models for simple tasks:

- Claude Haiku: $0.25/1M input tokens (fast, cheap)
Claude Sonnet: $3/1M input tokens (balanced)
Claude Opus: $15/1M input tokens (expensive, powerful)

Routing rules:
CODEBLOCK2

2. Context Management

Reduce token waste:

- Clear old conversation context regularly
Don't store tool outputs in context
Use concise system prompts
Limit heartbeat frequency

3. Heartbeat Optimization

Common mistake:
CODEBLOCK3

Best practices:

- Combine multiple checks into one heartbeat
Use longer intervals (4-6 hours)
Skip nighttime heartbeats (23:00-08:00)
Track heartbeat costs separately

Cost Tracking Dashboard

Daily Cost Breakdown

Category	Tokens	Cost
Heartbeat checks	50,000	$0.50
Web searches

100,000 | $1.00 | | Code generation | 200,000 | $2.00 | | Document analysis | 150,000 | $1.50 | | Total | 500,000 | $5.00/day |

Monthly Projection

CODEBLOCK4

Budget Alerts Setup

Tier 1: Light User ($10-30/month)

CODEBLOCK5

Tier 2: Regular User ($40-80/month)

CODEBLOCK6

Tier 3: Power User ($100-500/month)

CODEBLOCK7

Cost Reduction Checklist

Immediate Actions (save 30-50%)

- [ ] Reduce heartbeat frequency to 4-6 hours
[ ] Route simple queries to Haiku
[ ] Clear context after completed tasks
[ ] Disable unnecessary automations

Medium-term (save 50-70%)

- [ ] Implement model routing rules
[ ] Optimize system prompts
[ ] Batch similar tasks together
[ ] Use caching for repeated queries

Long-term (save 70-90%)

- [ ] Build cost-aware agent behaviors
[ ] Implement token budgets per task
[ ] Use local models for simple tasks
[ ] Optimize tool output storage

Monitoring Commands

Real-time Cost Check

CODEBLOCK8

Historical Analysis

CODEBLOCK9

Anomaly Detection

CODEBLOCK10

Integration Examples

Slack/Discord Alerts

CODEBLOCK11

Email Reports

CODEBLOCK12

Cost Optimization Scripts

Auto-pause Expensive Sessions

CODEBLOCK13

Model Router

CODEBLOCK14

Common Cost Pitfalls

❌ Mistake: Infinite Loops

Agent keeps calling itself → 1000s of API calls → $100+ in hours

Fix: Implement loop detection and limits

❌ Mistake: Storing Tool Outputs

Every tool output saved to context → Context grows → Each call costs more

Fix: Only store essential information

❌ Mistake: Wrong Model for Task

Using Opus for weather queries → 60x more expensive than needed

Fix: Implement model routing

❌ Mistake: Heartbeat Misconfiguration

Heartbeat every 5 minutes → 288 calls/day → $50+/day

Fix: Use 4-6 hour intervals

Pricing Reference (2026)

Anthropic Claude
Model Input Output Best For
Haiku $0.25/1M $1.25/1M Simple queries, facts
Sonnet
$3/1M | $15/1M | General tasks |

Model	Input	Output	Best For
Haiku	$0.25/1M	$1.25/1M	Simple queries, facts
Sonnet

| Opus | $15/1M | $75/1M | Complex analysis |

OpenAI GPT
Model Input Output Best For
GPT-4o Mini $0.15/1M $0.60/1M Simple queries
GPT-4o
$2.5/1M | $10/1M | General tasks |

Model	Input	Output	Best For
GPT-4o Mini	$0.15/1M	$0.60/1M	Simple queries
GPT-4o

| o1 | $15/1M | $60/1M | Complex reasoning |

Google Gemini
Model Input Output Best For
Flash $0.075/1M $0.30/1M Simple queries
Pro
$1.25/1M | $5/1M | General tasks |

Model	Input	Output	Best For
Flash	$0.075/1M	$0.30/1M	Simple queries
Pro

| Ultra | $7.5/1M | $30/1M | Complex analysis |

ROI Calculator

Calculate if automation is worth it:

CODEBLOCK19

Updates

- 2026-03-27: Initial release
Pricing as of March 2026
Based on real user cost data

Token 成本监控

实时监控 OpenClaw API 成本，设置预算警报，优化模型支出。

为何重要

真实用户案例：

- 一位用户因心跳检测询问现在是白天吗？一夜花费 18.75 美元
Federico Viticci 单月花费 3,600 美元
普通用户因自动化配置错误每天账单达 200 美元

快速命令

检查当前会话成本：
bash

查看 Token 使用量和预估成本

openclaw /status
openclaw /usage

设置成本警报：
bash

当日支出超过 10 美元时警报

echo 如果 daily_cost > $10 则警报

当月支出超过 100 美元时警报

echo 如果 monthly_cost > $100 则警报

成本优化策略

1. 模型路由

简单任务使用更便宜的模型：

- Claude Haiku：每百万输入 Token 0.25 美元（快速、便宜）
Claude Sonnet：每百万输入 Token 3 美元（均衡）
Claude Opus：每百万输入 Token 15 美元（昂贵、强大）

路由规则：

简单查询（天气、事实）→ Haiku
复杂分析 → Sonnet
创意写作 → Opus（仅在需要时）

2. 上下文管理

减少 Token 浪费：

- 定期清理旧对话上下文
不在上下文中存储工具输出
使用简洁的系统提示
限制心跳频率

3. 心跳优化

常见错误：

❌ 每 30 分钟：现在是白天吗？ → 每晚 18.75 美元
✅ 每 6 小时：检查邮件 + 日历 → 每天 2 美元

最佳实践：

- 将多次检查合并为一次心跳
使用较长间隔（4-6 小时）
跳过夜间心跳（23:00-08:00）
单独跟踪心跳成本

成本跟踪仪表盘

每日成本明细

类别	Token 数	成本
心跳检查	50,000	0.50 美元
网页搜索

100,000 | 1.00 美元 | | 代码生成 | 200,000 | 2.00 美元 | | 文档分析 | 150,000 | 1.50 美元 | | 总计 | 500,000 | 每天 5.00 美元 |

月度预测

日均：5.00 美元
月度预测：150.00 美元
预算限制：100.00 美元
⚠️ 警告：将超出预算 50 美元

预算警报设置

第一级：轻度用户（每月 10-30 美元）

每日限制：1.00 美元
警报阈值：每天 0.80 美元
措施：降低心跳频率，更多使用 Haiku

第二级：普通用户（每月 40-80 美元）

每日限制：2.50 美元
警报阈值：每天 2.00 美元
措施：优化上下文，审查模型路由

第三级：重度用户（每月 100-500 美元）

每日限制：10.00 美元
警报阈值：每天 8.00 美元
措施：审计所有自动化，实施严格路由

成本降低清单

立即行动（节省 30-50%）

- [ ] 将心跳频率降低至 4-6 小时
[ ] 将简单查询路由至 Haiku
[ ] 完成任务后清除上下文
[ ] 禁用不必要的自动化

中期行动（节省 50-70%）

- [ ] 实施模型路由规则
[ ] 优化系统提示
[ ] 批量处理相似任务
[ ] 对重复查询使用缓存

长期行动（节省 70-90%）

- [ ] 构建成本感知的智能体行为
[ ] 为每个任务实施 Token 预算
[ ] 简单任务使用本地模型
[ ] 优化工具输出存储

监控命令

实时成本检查

bash

获取当前会话统计

openclaw /status

获取详细使用情况明细

openclaw /usage --detailed

历史分析

bash

过去 7 天成本趋势

echo 分析过去 7 天的支出趋势

识别最昂贵的任务

echo 我花费最高的 5 种任务类型是什么？

异常检测

bash

如果支出是正常值的 2 倍则警报

echo 如果 hourlycost > 2 * averagehourly_cost 则警报

集成示例

Slack/Discord 警报

bash

向 Slack 发送每日成本摘要

curl -X POST https://hooks.slack.com/services/YOUR/WEBHOOK/URL \ -d {text: 每日 OpenClaw 成本：5.00 美元（预算：10.00 美元）}

邮件报告

bash

通过邮件发送每周成本报告

echo 每周成本报告：总计 35.00 美元，日均 5.00 美元 | mail -s OpenClaw 成本报告 user@example.com

成本优化脚本

自动暂停昂贵会话

bash #!/bin/bash

如果每日成本超过限制则暂停会话

DAILY_LIMIT=10
CURRENTCOST=$(getcurrent_cost)

if (( $(echo $CURRENTCOST > $DAILYLIMIT | bc -l) )); then
echo ⚠️ 每日成本（$CURRENTCOST）超过限制（$DAILYLIMIT）
echo 暂停非必要自动化...
# 在此添加暂停逻辑
fi

模型路由器

bash #!/bin/bash

根据复杂度将查询路由至适当模型

QUERY=$1
WORD_COUNT=$(echo $QUERY | wc -w)

if [ $WORD_COUNT -lt 20 ]; then
echo 使用 Haiku（简单查询）
MODEL=haiku
elif [ $WORD_COUNT -lt 100 ]; then
echo 使用 Sonnet（中等复杂度）
MODEL=sonnet
else
echo 使用 Opus（复杂分析）
MODEL=opus
fi

常见成本陷阱

❌ 错误：无限循环

智能体不断调用自身 → 数千次 API 调用 → 数小时内超过 100 美元

修复： 实施循环检测和限制

❌ 错误：存储工具输出

每个工具输出都保存到上下文 → 上下文增长 → 每次调用成本增加

修复： 仅存储必要信息

❌ 错误：任务使用错误模型

使用 Opus 进行天气查询 → 比所需贵 60 倍

修复： 实施模型路由

❌ 错误：心跳配置错误

每 5 分钟心跳一次 → 每天 288 次调用 → 每天 50 美元以上

修复： 使用 4-6 小时间隔

定价参考（2026）

Anthropic Claude
模型输入输出最佳用途
Haiku 每百万 0.25 美元每百万 1.25 美元简单查询、事实
Sonnet
每百万 3 美元 | 每百万 15 美元 | 一般任务 |

模型	输入	输出	最佳用途
Haiku	每百万 0.25 美元	每百万 1.25 美元	简单查询、事实
Sonnet

OpenAI GPT
模型输入输出最佳用途
GPT-4o Mini 每百万 0.15 美元每百万 0.60 美元简单查询
GPT-4o
每百万 2.5 美元 | 每百万 10 美元 | 一般任务 |

模型	输入	输出	最佳用途
GPT-4o Mini	每百万 0.15 美元	每百万 0.60 美元	简单查询
GPT-4o

Google Gemini
模型输入输出最佳用途
Flash 每百万 0.075 美元每百万 0.30 美元简单查询
Pro
每百万 1.25 美元 | 每百万 5 美元 | 一般任务 |

模型	输入	输出	最佳用途
Flash	每百万 0.075 美元	每百万 0.30 美元	简单查询
Pro

ROI 计算器

计算自动化是否值得：

手动任务时间：30 分钟
您的时薪：50 美元/小时
手动成本：每任务 25 美元

自动化成本：

- API

token-cost-monitor令牌成本监控