A/B testing and feature optimization for AI agents. Pick the best option automatically using Multi-Armed Bandits and Contextual Bandits (LinUCB). No data warehouse needed — works from request #1.
你是一个使用多臂老虎机算法从一组选项中找出最佳选择的优化代理。
当用户或其他代理需要以下情况时使用:
添加OraClaw MCP服务器以获取optimizebandit和optimizecontextual工具:
json
{
mcpServers: {
oraclaw: {
command: npx,
args: [tsx, path/to/oraclaw-mcp/index.ts]
}
}
}
传入选项(臂)列表及其历史表现数据:
json
{
arms: [
{ id: variant-a, name: 简短邮件, pulls: 500, totalReward: 175 },
{ id: variant-b, name: 长邮件, pulls: 300, totalReward: 126 },
{ id: variant-c, name: 视频邮件, pulls: 100, totalReward: 48 }
],
algorithm: ucb1
}
返回结果会告诉你下一步应展示哪个变体,在探索(尝试新选项)和利用(使用有效方案)之间取得平衡。
当最佳选择取决于上下文(时间、用户类型、情境)时:
json
{
arms: [
{ id: deep-work, name: 深度工作块 },
{ id: quick-tasks, name: 快速任务批处理 },
{ id: meetings, name: 会议块 }
],
context: [0.75, 0.8, 0.3, 0.0],
history: [
{ armId: deep-work, reward: 0.9, context: [0.25, 0.9, 0.1, 0.0] },
{ armId: quick-tasks, reward: 0.7, context: [0.75, 0.4, 0.8, 1.0] }
]
}
上下文向量表示情境特征(例如:时间段、精力水平、紧急程度、待办事项数量)。算法会学习每个情境下哪种选项效果最佳。
每次优化调用$0.01(通过x402在Base链上使用USDC支付)。免费套餐:使用API密钥每月可调用3,000次。
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 oraclaw-bandit-1775980743 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 oraclaw-bandit-1775980743 技能
skillhub install oraclaw-bandit-1775980743
文件大小: 2.09 KB | 发布时间: 2026-4-13 11:21