MLOps Prototyping 🔬
Create standardized, reproducible Jupyter notebooks.
Features
1. Notebook Structure Check ✅
Validate notebook follows best practices:
CODEBLOCK0
Checks for:
- - H1 title
- Imports section
- Config/Constants
- Data loading
- Pipeline usage
2. Template 📝
Use this structure:
- 1. Title & Purpose
- Imports (standard → third-party → local)
- Configs (all constants at top)
- Datasets (load, validate, split)
- Analysis (EDA)
- Modeling (use
sklearn.pipeline.Pipeline) - Evaluations (metrics on test data)
Quick Start
CODEBLOCK1
Key Rules
✅ DO:
- - Put all params in Config section
- Use INLINECODE1
- Split data BEFORE any transforms
- Set
random_state everywhere
❌ DON'T:
- - Magic numbers in code
- Manual transforms (use Pipeline)
- Fit on full dataset (data leakage)
Author
Converted from MLOps Coding Course
Changelog
v1.0.0 (2026-02-18)
- - Initial OpenClaw conversion
- Added notebook checker
MLOps 原型开发 🔬
创建标准化、可复现的 Jupyter 笔记本。
功能特性
1. 笔记本结构检查 ✅
验证笔记本是否遵循最佳实践:
bash
./scripts/check-notebook.sh notebook.ipynb
检查项包括:
- - H1 标题
- 导入模块部分
- 配置/常量
- 数据加载
- 管道使用
2. 模板 📝
使用以下结构:
- 1. 标题与目的
- 导入模块(标准库 → 第三方库 → 本地库)
- 配置(所有常量置于顶部)
- 数据集(加载、验证、拆分)
- 分析(探索性数据分析)
- 建模(使用 sklearn.pipeline.Pipeline)
- 评估(测试数据上的指标)
快速开始
bash
检查你的笔记本
./scripts/check-notebook.sh my-notebook.ipynb
遵循笔记本中的结构
对所有转换使用 Pipeline
在所有地方设置 RANDOM_STATE
关键规则
✅ 应做事项:
- - 将所有参数放在配置部分
- 使用 sklearn.pipeline.Pipeline
- 在任何转换之前拆分数据
- 在所有地方设置 random_state
❌ 禁止事项:
- - 代码中出现魔法数字
- 手动转换(应使用 Pipeline)
- 在完整数据集上拟合(数据泄露)
作者
改编自 MLOps 编码课程
更新日志
v1.0.0(2026-02-18)
- - 初始 OpenClaw 转换
- 新增笔记本检查工具