返回顶部
m

ml-opsMLOps工作流

Deep MLOps workflow—reproducible training, experiment tracking, packaging, deployment, monitoring (drift, performance), governance, and rollback for ML. Use when shipping models to production or hardening ML pipelines.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
118
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

ml-ops

MLOps(深度工作流)

MLOps将研究速度生产可靠性相连接:对数据代码制品进行统一版本管理;在部署后监控行为

何时提供此工作流

触发条件:

  • - 首个生产模型;批处理或在线服务
  • 漂移、偏差或延迟SLO未达标
  • 合规性需要可追溯性和可解释性

初始提供:

使用六个阶段:(1)问题与风险分类,(2)数据与可复现性,(3)训练与评估,(4)打包与部署,(5)监控与反馈,(6)治理与回滚。确认批处理与实时处理以及监管层级。



阶段1:问题与风险分类

目标: 将机器学习与决策风险(信贷、健康与推荐)对齐。

退出条件: 定义离线与在线成功指标。



阶段2:数据与可复现性

目标: 快照训练数据;确定性流水线;PII处理。

实践

  • - 特征存储可选但有助于一致性
  • 密钥不在笔记本中;使用编排作业

退出条件: 运行ID在约定范围内复现制品哈希值。



阶段3:训练与评估

目标: 无泄漏的训练/验证/测试;时间序列分割需谨慎。

实践

  • - 包含限制和指标的模型卡片
  • 政策要求时进行公平性切片

阶段4:打包与部署

目标: 不可变制品;完全切换前进行金丝雀或影子部署。

实践

  • - 模型与预处理代码版本固定绑定

退出条件: 记录回滚到先前制品ID的文档。



阶段5:监控与反馈

目标: 数据漂移、概念漂移、延迟;业务KPI与模型决策关联。

实践

  • - 必要时为低置信度预测设置人工审核队列

阶段6:治理与回滚

目标: 重新训练/部署的审批;审计追踪;重大变更进行A/B测试。



最终审查清单

  • - [ ] 离线指标与业务风险对齐
  • [ ] 数据和代码可复现性
  • [ ] 打包制品具有版本控制和回滚能力
  • [ ] 在线监控和漂移策略
  • [ ] 治理和审批路径

有效指导建议

  • - 训练-服务偏差是首要问题——特征一致性测试有助于解决。
  • 离线准确率≠在线业务成果。
  • 公平性需要明确的切片——而非单一总体数字。

偏差处理

  • - 重度LLM产品:依赖评估框架和提示版本管理(参见llm-evaluation)。
  • 小型团队:在完整特征存储之前,从制品注册表和仪表板开始。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ml-ops-1776028739 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ml-ops-1776028739 技能

通过命令行安装

skillhub install ml-ops-1776028739

下载

⬇ 下载 ml-ops v1.0.0(免费)

文件大小: 1.89 KB | 发布时间: 2026-4-13 11:04

v1.0.0 最新 2026-4-13 11:04
- Initial release of the "ml-ops" skill featuring a comprehensive MLOps workflow.
- Covers reproducible training, experiment tracking, packaging, deployment, monitoring (drift, performance), governance, and rollback.
- Introduces six workflow stages: problem & risk class, data & reproducibility, training & evaluation, packaging & deployment, monitoring & feedback, governance & rollback.
- Provides practical triggers, stage exit conditions, and a final review checklist.
- Includes tips for preventing common pitfalls and adapting practices for LLM products or small teams.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部