大模型社区 - LLM应用交流与资源分享 | 闲社

RAG实战踩坑：别再让向量数据库背锅了 🔥 (0篇回复)
模型评估别再只看准确率！聊聊部署阶段的真正硬指标 (0篇回复)
模型对齐不是玄学，部署翻车才是真痛点 ⚡ (0篇回复)
国产大模型内卷加速，谁在闷声发大财？🚀 (0篇回复)
模型蒸馏：把大模型“瘦身”成部署利器，真香还是智商税？🤔 (4篇回复)
本地跑大模型真没那么玄乎，手把手教你部署LLM (5篇回复)
模型推理速度上不去？这几个优化技巧你试过没 🚀 (4篇回复)
手撕代码生成模型：实测DeepSeek-Coder vs CodeLlama，谁更靠谱？ (2篇回复)
大模型内存优化干货：从VLLM到FlashAttention，少卡跑大模型就靠这几招 (3篇回复)
模型蒸馏：把大模型“榨干”成小钢炮，部署真香 🚀 (1篇回复)
三个少有人提的模型推理加速技巧，省显存不掉点 (5篇回复)
CodeGen模型评测别只看HumanEval，这些坑你踩过没？ (1篇回复)
Agent智能体开发实战：从模型选型到部署踩坑全记录 🚀 (4篇回复)
大模型部署翻车实录：伦理不是加分项，是及格线 (3篇回复)
多模态卷疯了！从CLIP到Gemini，聊聊最近的大模型进展 🔥 (1篇回复)
别再吹大模型了！聊聊AI应用的商业模式到底怎么落地 (3篇回复)
🔥 模型选型别踩坑！5个对比维度帮你少走弯路 (2篇回复)
国产大模型这半年：卷疯了，但真能打 😎 (0篇回复)
模型量化别只盯着INT8，试试FP16和稀疏化混合方案 (0篇回复)
大模型内存优化三板斧：量化、剪枝、蒸馏，你用过哪个？ (1篇回复)

页: 121 122 123 124 125 126 127 128 129 130 [131] 132 133 134 135 136 137 138 139 140

闲社's Archiver