返回顶部
m

model-migrate-flagos模型迁移标志

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
98
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

model-migrate-flagos

FL 插件 — 模型迁移技能

用法

/model-migrate-flagos <模型名称> [上游文件夹] [插件文件夹]

参数是否必需默认值
模型名称
上游文件夹
否 | /tmp/vllm-upstream-ref | | 插件文件夹 | 否 | 当前工作目录 |

执行流程

步骤 1:解析参数并验证路径

从用户输入中提取:

  • - {{模型名称}} = 第一个参数(必需,蛇形命名)
  • {{上游文件夹}} = 第二个参数或 /tmp/vllm-upstream-ref
  • {{插件文件夹}} = 第三个参数或当前工作目录

如果 {{上游文件夹}} 不存在,询问用户是否克隆。如果 {{插件文件夹}} 不存在,报错退出。

→ 告知用户:确认解析后的模型名称和路径。

步骤 2:加载参考文件并解析占位符

读取以下文件(相对于本 SKILL.md):

  • - references/procedure.md — 逐步迁移流程
  • references/compatibility-patches.md — 0.13.0 补丁目录
  • references/operational-rules.md — 通信、任务列表、bash 规则、弹性策略

流程中引用了 scripts/ 中的可执行脚本:

  • - scripts/validatemigration.py — 自动化代码审查(步骤 6)
  • scripts/benchmark.sh — 基准测试验证(步骤 9)
  • scripts/serve.sh — 本地部署模型(步骤 10.1,也用于端到端测试)
  • scripts/request.sh — 测试请求(步骤 10.2)
  • scripts/e2eeval.py — 端到端正确性验证(步骤 11)
  • scripts/e2etestprompts.json — 端到端测试提示词(5 个文本 + 5 个多模态)
  • scripts/e2econfig.template.json — 端到端配置模板(复制为 e2econfig.json 并填写)
  • scripts/e2eremoteserve.sh — 通过 SSH 管理远程机器上的 GT 服务器

然后调查上游源码 + HuggingFace 以解析所有占位符:

占位符推导方式
{{模型名称}}直接来自参数
{{模型名称小写}}
模型名称的小写形式(通常相同,例如 qwen35)— 用于文件路径 |
| {{模型显示名称}} | 来自上游代码或 HF 模型卡片 |
| {{模型类名}} | 来自上游模型类(大驼峰命名) |
| {{模型类型}} | 来自 HF config.json 的 model_type 字段 |
| {{配置类名}} | 来自上游或从模型类型推导 |
| {{技能根目录}} | 本技能文件夹的绝对路径(包含此 SKILL.md 的目录) |

不同模型的命名约定各异 — 务必从实际源码验证,切勿猜测。

→ 告知用户:展示所有已解析的值。如有任何歧义,使用 AskUserQuestion。

步骤 3:执行流程

占位符解析完成后,按顺序执行 procedure.md 中的每一步。在复制后修补步骤中应用 compatibility-patches.md 中的补丁。全程遵循 operational-rules.md。

→ 告知用户:开始前,输出编号计划。在每个步骤边界报告进度。

脚本参考

脚本步骤描述
validate_migration.py6自动化导入/API/注册检查
benchmark.sh
9 | 使用虚拟权重的 vllm bench throughput | | serve.sh | 10, 11 | 启动本地 vLLM 服务器(端口 8122,VLLMFLPREFER_ENABLED=false) | | request.sh | 10 | 快速冒烟测试请求 | | e2e_eval.py | 11 | 与上游 GT 服务器的 Token 级别对比 | | e2etestprompts.json | 11 | 5 个文本 + 5 个多模态测试提示词 | | e2e_config.template.json | 11 | 配置模板(GT 机器、本地端口、评估参数) | | e2eremoteserve.sh | 11 | 基于 SSH 的 GT 服务器生命周期管理(启动/停止/状态/日志) |

示例

示例 1:典型新模型

用户说:/model-migrate-flagos kimi_k25
操作:
1. 解析 → 模型名称=kimi_k25,上游/插件路径使用默认值
2. 克隆上游,找到 vllm/modelexecutor/models/kimik25.py
3. 发现它封装了 DeepseekV2 → 遵循 kimi_k25(封装器)模式
4. 复制文件,应用 P1+P2 补丁,创建配置桥接
5. 注册、验证、测试、基准测试、部署+请求
6. 与上游 GT 进行端到端验证
结果:kimi_k25 在插件中完全可用,全部 11 个步骤通过

示例 2:上游更新后重新运行

用户说:重新迁移 qwen3_5,上游已更新
操作:
1. 幂等重运行 — 用新的上游副本覆盖现有文件
2. 重新应用补丁,重新验证,重新测试
3. 重新运行端到端测试以确认无回归
结果:qwen3_5 更新至最新上游版本,无回归

故障排除

通用原则:发生任何运行时错误时,首先将 vLLM 上游代码与插件适配及已安装的 0.13.0 环境进行对比。差异是定位根因的最快途径。详见 operational-rules.md § 调试优先级:上游优先 的完整协议。

问题典型原因修复方法
复制后修补出现 ImportError缺少 P1 修复(相对→绝对导入)验证所有 from .xxx 已转换为 from vllm. 或 from vllm_fl.
AttributeError: module vllm has no attribute X
0.13.0 中不存在该 API | 检查 compatibility-patches.md 中的 P3;存根或移除 |
| vLLM 无法识别配置 | modeltype 不匹配或缺少配置桥接 | 验证 CONFIGREGISTRY[modeltype] 与 HF config.json 完全一致 |
| 注册无效 | 类名或导入路径拼写错误 | 与 init.py 中的现有注册项对比 |
| 基准测试 KeyError 配置字段 | 配置桥接缺少字段 | 对比上游配置类与桥接;添加缺失字段及默认值 |
| 基准测试/部署因 OOM 或内存不足失败 | GPU 被其他进程占用 | 终止 GPU 进程:nvidia-smi --query-compute-apps=pid --format=csv,noheader \| xargs -r kill -9 然后重试。切勿跳过这些步骤。 |
| 模型输出乱码/无意义文本 | 合并投影使用了 ColumnParallelLinear 但子维度不同(TP 分片不匹配) | 重写 init 使用 MergedColumnParallelLinear(output_sizes=[...])。参见 compatibility-patches.md 中的 P8 |
| AssertionError: Duplicate op name | 子类从与父类不同的模块路径导入自定义算子 | 使用与父模块相同的导入路径(例如 vllmfl.ops.fla 而非 vllmfl.models.fla_ops)。参见 P11 |
| CUDA 图预热期间 fusedrecurrent* 出现 AttributeError | 使用 nn.Module.init(self) 重写 init 时遗漏了继承的 forwardcore 所使用的属性 | 创建父类 init 中的所有属性,特别是自定义算子。参见 P12 |
| 端到端:本地服务器无法访问 | serve.sh 端口与 e2e_config.json 本地端口不匹配 | 确保两者使用相同端口(默认 8122) |
| 端到端:GT 服务器无法访问 | GT 机器宕机或 docker/conda 环境错误 | 检查 e2eremoteserve.sh status 或手动 SSH |
| 端到端:早期 Token 差异(前 5 个 Token) | 权重加载

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 model-migrate-flagos-1776078663 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 model-migrate-flagos-1776078663 技能

通过命令行安装

skillhub install model-migrate-flagos-1776078663

下载

⬇ 下载 model-migrate-flagos v1.0.0(免费)

文件大小: 111.33 KB | 发布时间: 2026-4-14 10:38

v1.0.0 最新 2026-4-14 10:38
Initial release of the model-migrate-flagos skill for FL Plugin model migration.

- Enables automated migration of models from latest vLLM upstream into the vllm-plugin-FL project (vLLM 0.13.0).
- Parses intent and arguments from user commands (supports model_name and optional folder overrides).
- Orchestrates a step-by-step migration: argument validation, reference loading, placeholder resolution, procedural execution, patch application, validation, benchmarking, and end-to-end testing.
- Integrates multiple scripts for validation, serving, benchmarking, and E2E evaluation.
- Designed for easy troubleshooting with a detailed error/solution table and strict protocol adherence.
- Triggered via phrases like "migrate X model" or "/model-migrate-flagos model_name".

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部