返回顶部
r

retro事后复盘

Deep blameless postmortem workflow—timeline, impact, root cause vs contributing factors, what went well/poorly, action items with owners, and follow-through. Use after incidents, outages, or near-misses to improve reliability culture.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
123
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

retro

事后复盘

优秀的事后复盘旨在学习而非归咎个人。它会产生可执行的行动项,以减少问题复发或提升检测能力——而非加强沟通这类泛泛之谈。

何时提供此工作流程

触发条件:

  • - SEV级事故、客户可见的中断、数据丢失风险
  • 值得记录的险情
  • 在易归咎文化中需要引导框架

初始建议:

采用六个阶段:(1) 范围与受众、(2) 时间线与影响、(3) 根因分析、(4) 有效/无效措施、(5) 行动项、(6) 沟通与跟进。确认是内部专用还是面向客户的总结。



阶段1:范围与受众

目标: 明确读者(高管、工程团队、客服团队),并隐去个人身份信息或敏感安全细节。

实践要点

  • - 在邀请函和模板中采用无责框架

完成条件: 选定模板;确定最终文档负责人。



阶段2:时间线与影响

目标: 以UTC时间为基准的分钟级时间线:发现 → 开始 → 缓解 → 解决。

影响评估

  • - 受影响用户数、持续时间、数据完整性(如相关)、SLA违规情况

完成条件: 事实与任何外部客户沟通内容保持一致。



阶段3:根因分析

目标: 将五个为什么或鱼骨图作为工具而非形式。区分根因(能阻止该类故障的修复措施)与促成因素(流程漏洞、缺失的测试)。

实践要点

  • - 不得将个人列为根因

完成条件: 有证据支撑的因果链;列出促成因素。



阶段4:有效/无效措施

目标: 强化正面措施(遵循操作手册、沟通清晰)与负面措施(缺失仪表盘、升级缓慢)。



阶段5:行动项

目标: 创建带有负责人和截止日期的具体工单;分类为预防/检测/恢复/流程。

实践要点

  • - 避免模糊的增加监控——明确指标或信号

完成条件: 工单已关联至问题追踪系统。



阶段6:沟通与跟进

目标: 内部共享摘要;仅在政策要求时发布外部复盘;在30/60天内跟踪完成情况。



最终审核清单

  • - [ ] 无责语气;时间线和事实准确
  • [ ] 尽可能量化影响
  • [ ] 区分根因与促成因素
  • [ ] 行动项有负责人、截止日期和跟踪状态
  • [ ] 已安排跟进审查

有效指导技巧

  • - 根据严重程度调整深度;轻微事故采用轻量级复盘。
  • 在附录中为工程师提供相关追踪、指标和日志链接。
  • 心理安全感促进坦诚——领导层需以身作则。

异常处理

  • - 安全事件:在公开细节前需与法务/信息安全部门协调。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 retro-1775975162 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 retro-1775975162 技能

通过命令行安装

skillhub install retro-1775975162

下载

⬇ 下载 retro v1.0.0(免费)

文件大小: 2.01 KB | 发布时间: 2026-4-13 11:48

v1.0.0 最新 2026-4-13 11:48
Initial release of the retro skill: a structured, blameless postmortem workflow.

- Guides users through six stages: scoping, timeline, root cause analysis, review of what worked/failed, action items, and follow-up.
- Focuses on clear ownership of action items and distinguished root cause vs contributing factors.
- Emphasizes psychological safety and tailored communication for both internal and external audiences.
- Provides best practices, final review checklist, and specific guidance for security incidents.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部