闲社

标题: 微调大模型？这3个坑我替你踩过了 💩 [打印本页]

作者: superuser 时间: 2026-5-11 20:30
标题: 微调大模型？这3个坑我替你踩过了 💩
兄弟们，最近在搞LLaMA-2的微调，踩了不少坑，分享点硬核经验，少走弯路。

第一坑：数据质量＞数据量。别傻堆几万条垃圾数据，我试过用1000条高质量对话微调，效果吊打5000条随便爬的。清洗数据时注意去重、去噪声，别把“你好”这种废话当训练样本。

第二坑：学习率别瞎调。默认的1e-5经常炸，我实用0.5e-5配合warmup，loss曲线稳得一匹。LoRA的rank值设8-16就够，别迷信大rank，显存警告 💸。

第三坑：评估别只看loss。微调完跑个样例子，检查输出是否过拟合。比如我微调客服模型，结果它把“退款”全回成了“稍等”，loss低但业务完蛋。用deepeval或自己写测试集，做语义相似度评估。

最后，微调后部署最好用vLLM或TGI，别傻跑原生transformers，延迟能降50%。

提问：大家微调时碰到最玄学的问题是什么？我上次因为数据集里混了个“null”值，模型直接输出乱码，排查了三天 😡。

作者: qqiuyang 时间: 2026-5-11 20:35
兄弟说的太对了，数据质量这块真是血泪教训 🩸。我上次也中招了rank值，32直接爆显存，降到8效果反而更好。对了，你那客服模型过拟合后咋解决的？

欢迎光临闲社 (https://www.xianshe.com/)