返回顶部
s

sla-monitorSLA监控配置

Set up SLA monitoring and uptime tracking for AI agents and services. Generates monitoring configs, alert rules, and incident response playbooks. Use when deploying agents to production and need reliability guarantees.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
524
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

sla-monitor

SLA 监控技能

目的

帮助团队为AI智能体和自动化服务搭建生产级监控体系。涵盖运行时间追踪、响应时间SLA、错误预算及事件升级流程。

适用场景

  • - 将AI智能体部署至生产环境
  • 为客户面向的自动化系统搭建监控
  • 为服务协议创建SLA文档
  • 构建事件响应流程

监控方案选项

方案一:UptimeRobot(提供免费套餐)

  • - 50个监控器免费,5分钟检测间隔
  • 支持HTTP、关键词、Ping、端口监控
  • 邮件+Slack+Webhook告警

方案二:Better Stack(原Uptime.com)

  • - 包含状态页面
  • 内置事件管理功能
  • 免费套餐:10个监控器

方案三:自托管方案(Uptime Kuma)

bash docker run -d --restart=always -p 3001:3001 -v uptime-kuma:/app/data --name uptime-kuma louislam/uptime-kuma:1

SLA等级

一级:标准版(1,500美元/月)

  • - 99.5%运行时间保证(每年43.8小时停机)
  • 4小时内响应(工作时间)
  • 月度性能报告

二级:专业版(3,000美元/月)

  • - 99.9%运行时间保证(每年8.76小时停机)
  • 1小时内响应(工作时间)
  • 周度性能报告
  • 季度优化评审

三级:企业版(5,000美元+/月)

  • - 99.95%运行时间(每年4.38小时停机)
  • 15分钟内响应(7×24小时)
  • 实时仪表盘访问
  • 专属支持通道

告警配置模板

yaml
monitors:
- name: 智能体健康检查
type: http
url: https://your-agent-endpoint/health
interval: 300 # 5分钟
alerts:
- type: email
threshold: 1 # 1次失败后告警
- type: slack
webhook: ${SLACK_WEBHOOK}
threshold: 2 # 连续2次失败后告警
- type: sms
threshold: 3 # 3次失败后升级

- name: API响应时间
type: http
url: https://your-agent-endpoint/api
interval: 60
expectedresponsetime: 2000 # 毫秒
alerts:
- type: slack
condition: response_time > 5000

error_budget:
monthly_target: 99.9
burnratealert: 2.0 # 当消耗速率达到正常2倍时告警

事件响应手册

一级严重性——完全中断

  1. 1. 5分钟内确认
  2. 10分钟内更新状态页面
  3. 30分钟内定位根本原因
  4. 2小时内解决或提供临时方案
  5. 24小时内完成事后复盘

二级严重性——性能降级

  1. 1. 15分钟内确认
  2. 30分钟内启动调查
  3. 4小时内解决
  4. 48小时内提交总结报告

三级严重性——轻微问题

  1. 1. 1小时内确认
  2. 24小时内解决
  3. 记录至下一评审周期

错误预算计算器

月度分钟数:43,200(30天)
99.9% SLA = 允许43.2分钟停机
99.5% SLA = 允许216分钟停机
99.0% SLA = 允许432分钟停机

消耗速率 = (实际停机时间 / 预算) × 100
若剩余2周以上且消耗速率 > 50% → 需评审
若消耗速率 > 80% → 冻结部署

状态页面模板

为客户提供公开状态页面,展示:

  • - 当前系统状态(正常运行/性能降级/中断)
  • 组件级状态(智能体A、智能体B、API、仪表盘)
  • 运行时间百分比(30天滚动)
  • 事件历史及解决方案说明
  • 计划维护窗口

后续步骤

需要内置SLA监控的托管AI智能体?
→ AfrexAI提供部署、监控和维护服务,1,500美元/月
→ 预约通话:https://calendly.com/cbeckford-afrexai/30min
→ 了解更多:https://afrexai-cto.github.io/aaas/landing.html

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 sla-monitor-1776075368 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 sla-monitor-1776075368 技能

通过命令行安装

skillhub install sla-monitor-1776075368

下载

⬇ 下载 sla-monitor v1.0.0(免费)

文件大小: 2.33 KB | 发布时间: 2026-4-14 10:22

v1.0.0 最新 2026-4-14 10:22
Initial release — SLA monitoring setup for AI agents

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部