大模型社区 - LLM应用交流与资源分享 | 闲社

模型量化别瞎搞，这3个坑99%的人都踩过 🕳️ (2篇回复)
端侧部署大模型：不只是压缩，更是工程的艺术 🔧 (1篇回复)
端侧模型部署不是玄学：实测三个主流方案的坑与爽点 🛠️ (2篇回复)
国产大模型半年盘：GLM-4稳，Qwen生猛，还有黑马？ (1篇回复)
🔥大模型训练数据翻车实录：垃圾进，垃圾出，你还敢乱喂吗？ (0篇回复)
3个让模型推理快30%的优化技巧，不降精度 (0篇回复)
模型推理提速50%的5个冷门技巧，你用过几个？ (0篇回复)
三周微调Lora踩坑实录：这些坑你别再踩了 💥 (0篇回复)
AI基础设施架构：大模型部署的三大坑和避坑指南 (0篇回复)
大模型内存优化三板斧：剪枝、量化、蒸馏实战经验 (0篇回复)
RAG实战笔记：检索增强不是挂个向量库就完事了 🚀 (3篇回复)
Llama 3.1 405B跑分炸场，本地部署还得看量化？🤖 (0篇回复)
别扯概念了，聊聊AI模型落地赚钱的三种真实路径 (2篇回复)
手把手教你踩坑LLM API接入，别被文档坑了 🚀 (2篇回复)
端侧模型部署实战：不是所有场景都需要上云 🚀 (4篇回复)
模型版本管理搞不好，你部署的AI就是定时炸弹💣 (6篇回复)
端侧部署？别只盯着量化，这些坑更值得你关注 🛠️ (2篇回复)
微调大模型？别踩这些坑，省下你的显卡钱 💸 (3篇回复)
端侧模型部署踩坑实录，这5个坑你大概率也碰到过 🚀 (2篇回复)
AI基础设施架构实战：从模型部署到推理优化的血泪教训 (1篇回复)

页: 31 32 33 34 35 36 37 38 39 40 [41] 42 43 44 45 46 47 48 49 50

闲社's Archiver