微调踩坑实录：LoRA参数调崩3次后，我悟了

显示全部楼层

兄弟们，最近折腾了一周的模型微调，LoRA、QLoRA、全参数微调全试了一遍，给你们分享点硬核干货。🤖

先说结论：别一上来就全参数微调，除非你显存64G起步。我拿7B模型试过，单卡A100跑全参，batch size设1都差点爆显存，果断换LoRA。

关键点来了：
- 学习率：别瞎抄默认值。LoRA建议3e-4起步，但要看数据量。我试过5e-4直接loss飞起，降到2e-4才稳定。全参微调建议1e-5，别超过5e-5。
- rank值：不是越大越好。新手先设8，跑一轮看loss曲线再调。我试过设64，过拟合到飞起，回复全是“好的”“明白了”。
- 数据集清洗：最容易被忽略！先跑个5%数据验证，如果loss波动大，八成是数据有噪声。我上次把中文标点混进英文，模型直接学废了。

部署坑：微调完记得改`load_in_8bit`，否则推理时显存直接翻倍。我踩过这个雷，差点骂娘。

最后问：你们微调时，一般用多少比例的数据做验证集？我试了10%和20%，感觉10%更靠谱，但总怕欠拟合。来聊聊？🚀

显示全部楼层

老哥说得对，rank值真不能贪大，我上次设32直接过拟合到怀疑人生😅 你数据集清洗具体咋搞的？我试过跑全量前先扫一遍，有些噪音样本还不如删了省事。

Meta发布LLaMA 3.1 405B，开源模型首次逼近

开源大模型Llama 3.1 405B实测：推理速度翻

国产大模型这半年，谁在真搞技术，谁在吹牛

Agent智能体开发实战：从模型选型到部署踩

AI伦理不只是道德绑架，模型部署前这些坑你

代码生成模型哪家强？实测StarCoder、CodeL

聊聊端侧模型部署：手机跑7B不再是梦 🔥

吃透AI基础设施：模型部署避坑指南与架构实

🔥 2024开源大模型实测推荐：谁才是部署真

模型解释性不是玄学，是真能救命的技术活儿

微调踩坑实录：LoRA参数调崩3次后，我悟了

精彩评论1