返回顶部
w

watchdog-heartbeat看门狗心跳

Monitor service health, heartbeat freshness, stuck workflows, and trigger recovery or degraded mode. Use on: high-frequency schedule, after system startup, when a workflow stalls, when heartbeat freshness must be verified. Triggered by watchdog cron jobs or health check requests.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
94
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

watchdog-heartbeat

看门狗心跳检测

为常驻OpenClaw系统提供可观测性和恢复感知能力。验证进程存活状态、心跳新鲜度及工作流完整性。

输入

必需参数:

  • - servicelist — 受监控服务列表及其预期健康状态
  • healthendpoints — 服务→健康检查端点或方法的映射
  • heartbeatrecords — 各代理/技能的最新心跳时间戳
  • workflowstatusrecords — 所有活跃工作流的当前状态
  • restartrecords — 服务重启与恢复事件的历史记录

输出结构

servicehealthsummary: {
service: string
status: healthy | degraded | down | unknown
last_check: string # ISO-8601格式
latency_ms: number | null
error: string | null
}[]

expiredheartbeatlist: {
agentorskill: string
last_heartbeat: string # ISO-8601格式
seconds_expired: number
severity: warning | critical
}[]

stuckworkflowlist: {
workflow_id: string
workflow_name: string
stuck_since: string # ISO-8601格式
stuckdurationmin: number
last_progress: string | null
severity: warning | critical
}[]

recovery_recommendation: {
action: restart | notify | escalate | noaction | degradedmode
target: string
reason: string
}[]

degradedmoderecommendation: {
affected_services: string[]
degraded_features: string[]
estimatedrecoverytime: string | null
user_impact: string
}

watchdog_log: {
check_id: string
check_time: string # ISO-8601格式
services_checked: number
heartbeats_checked: number
workflows_checked: number
issues_found: number
observability_gap: string[] | null
}

规则

  1. 1. 进程存活≠健康状态。 需检查近期成功记录,而非仅确认进程存在。
  2. 过期心跳需触发关注。 不得忽略过期心跳信号。
  3. 卡死工作流必须明确上报。 不允许其无声无息地消失。
  4. 静默故障不可接受。 若发生故障且无人获知,即构成系统级故障。
  5. 区分警告与严重级别。 警告=可能自动恢复。严重=需要人工干预。

心跳过期阈值

过期秒数严重级别
< 60秒健康
60秒 – 300秒
警告 | | > 300秒 | 严重 |

工作流卡死阈值

持续时间严重级别
< 10分钟健康(运行中)
10 – 30分钟
警告 | | > 30分钟 | 严重 |

恢复操作

  • - noaction — 处于正常参数范围内
  • notify — 通知人工,不自动重启
  • restart — 尝试自动重启
  • escalate — 需要人工干预
  • degradedmode — 降低功能,维持部分服务

故障处理

若监控数据不完整:

  • - 在observability_gap中列出缺失字段名称
  • 将受影响服务的status报告为unknown
  • 不得伪造健康状态
  • 若关键服务存在可观测性缺口,建议执行escalate操作

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 watchdog-heartbeat-1775978641 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 watchdog-heartbeat-1775978641 技能

通过命令行安装

skillhub install watchdog-heartbeat-1775978641

下载

⬇ 下载 watchdog-heartbeat v1.0.0(免费)

文件大小: 2.04 KB | 发布时间: 2026-4-13 12:31

v1.0.0 最新 2026-4-13 12:31
Initial release: monitor service health, heartbeat freshness, stuck workflows

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部