返回顶部
F

Fine-Tuning微调大模型

Fine-tune LLMs with data preparation, provider selection, cost estimation, evaluation, and compliance checks.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
739
下载量
免费
免费
2
收藏
概述
安装方式
版本历史

Fine-Tuning

技能名称:微调

适用场景

用户想要微调语言模型、评估微调是否值得,或调试训练问题。

快速参考

主题文件
供应商对比与定价providers.md
数据准备与验证
data-prep.md | | 训练配置 | training.md | | 评估与调试 | evaluation.md | | 成本估算与投资回报率 | costs.md | | 合规与安全 | compliance.md |

核心能力

  1. 1. 决策适配 — 分析微调是否比提示工程更适合当前用例
  2. 数据准备 — 将原始数据转换为JSONL格式、去重、验证格式
  3. 供应商选择 — 根据约束条件对比OpenAI、Anthropic(Bedrock)、Google、开源方案
  4. 成本估算 — 计算训练成本、推理节省、盈亏平衡点
  5. 训练配置 — 设置超参数(学习率、训练轮数、LoRA秩)
  6. 运行评估 — 在任务特定指标上对比微调模型与基础模型
  7. 故障调试 — 诊断损失曲线、过拟合、灾难性遗忘
  8. 合规处理 — 扫描个人身份信息、配置本地训练、生成审计日志

决策检查清单

在推荐微调之前,请确认:

  • - [ ] 提示工程的失败模式是什么?(格式、风格、知识、成本)
  • [ ] 有多少训练样本可用?(最少50-100个)
  • [ ] 预期推理量是多少?(影响投资回报率计算)
  • [ ] 隐私约束有哪些?(决定供应商选项)
  • [ ] 训练和持续推理的预算?

微调与提示决策对比

信号建议
格式/风格不一致微调 ✓
缺少领域知识
先使用RAG,必要时再微调 | | 高推理量(每月超过10万次) | 微调以节省成本 | | 需求频繁变化 | 坚持使用提示工程 | | 少于50个高质量样本 | 提示工程+少样本学习 |

关键规则

  • - 数据质量重于数量 — 100个优质样本胜过1000个噪声样本
  • 优先使用LoRA — 切勿直接进行全参数微调;LoRA成本低10-100倍
  • 保留评估集 — 始终按80/10/10比例划分;切勿窥探测试数据
  • 保持相同精度 — 训练和推理使用相同精度(4位、16位)
  • 先建立基线 — 在训练前对基础模型进行评估,以衡量实际改进
  • 预期迭代 — 首次尝试很少达到最优;计划2-3轮迭代

常见陷阱

错误修复方法
在不一致的数据上训练训练前人工审核100个以上样本
学习率过高
监督微调从2e-4开始,强化学习从5e-6开始 | | 期望获得新知识 | 微调调整行为而非知识——使用RAG | | 未进行基线对比 | 始终在相同评估集上测试基础模型 | | 忽略遗忘问题 | 混合20%通用数据以保留能力 |

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 fine-tuning-1776420035 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 fine-tuning-1776420035 技能

通过命令行安装

skillhub install fine-tuning-1776420035

下载

⬇ 下载 Fine-Tuning v1.0.0(免费)

文件大小: 13.58 KB | 发布时间: 2026-4-17 19:16

v1.0.0 最新 2026-4-17 19:16
Initial release

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部