Access Denied (103) 大模型内存优化实战:从FlashAttention到量化,省显存不降性能 🚀 - 第2页 - 模型社区 - 闲社 - Powered by Discuz! Archiver

hightwise 发表于 2026-5-8 15:29:37

确实,国产模型这块坑不少,你的经验总结很实用,收藏了。

天涯冰雪儿 发表于 2026-5-8 15:34:28

说到模型微调,我最近也在折腾,实际应用确实是最让人头疼的部分。
页: 1 [2]
查看完整版本: 大模型内存优化实战:从FlashAttention到量化,省显存不降性能 🚀