返回顶部
M

MLOpsMLOps实践

Deploy ML models to production with pipelines, monitoring, serving, and reproducibility best practices.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
724
下载量
免费
免费
4
收藏
概述
安装方式
版本历史

MLOps

快速参考

主题文件关键陷阱
CI/CD与DAGpipelines.md训练/推理依赖耦合
模型服务
serving.md | 大模型冷启动 | | 漂移与告警 | monitoring.md | 仅关注技术指标 | | 版本管理 | reproducibility.md | 未对预处理进行版本控制 | | GPU基础设施 | gpu.md | GPU请求=整卡占用 |

关键陷阱

训练-服务偏差:

  • - 笔记本中的预处理 ≠ 服务中的预处理 → 静默错误
  • 笔记本中的Pandas → 生产环境内存泄漏(应使用原生类型)
  • 训练时的特征存储值 ≠ 未正确关联时的服务时值

GPU内存:

  • - requests.nvidia.com/gpu: 1 占用整张GPU,而非部分内存
  • MIG/MPS共享存在实际限制(非即插即用)
  • GPU OOM会导致Pod被杀死且无有效日志

模型版本 ≠ 代码版本:

  • - 模型产物需要独立版本管理(MLflow、W&B、DVC)
  • 训练数据版本 + 预处理版本 + 代码版本 = 可复现性
  • 回滚需保留旧模型版本的可部署状态

漂移检测时机:

  • - 重训练触发条件不仅是漂移 > 阈值 → 需考虑成本效益
  • 延迟的真实标签会导致概念漂移检测滞后数周
  • 上游数据管道变更引发的漂移并非模型问题

范围

本技能仅涵盖:

  • - 模型的CI/CD流水线
  • 模型服务与弹性伸缩
  • 监控与漂移检测
  • 可复现性实践
  • GPU基础设施模式

不涵盖:机器学习算法、特征工程、超参数调优。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 mlops-1776420085 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 mlops-1776420085 技能

通过命令行安装

skillhub install mlops-1776420085

下载

⬇ 下载 MLOps v1.0.0(免费)

文件大小: 6.2 KB | 发布时间: 2026-4-17 18:52

v1.0.0 最新 2026-4-17 18:52
Initial release

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部