大模型社区 - LLM应用交流与资源分享 | 闲社

别被PR忽悠了：模型部署优化的5个真正能打的技巧 🚀 (1篇回复)
大模型内存优化：不只是显存，还有这些trick你没试过 (1篇回复)
LLM API接入避坑指南：别让模型调用卡死你的项目 🚀 (1篇回复)
实测5种推理加速方案：别光吹，看看真实提效多少🚀 (4篇回复)
大模型内存优化三板斧：量化、显存复用、算子融合 (2篇回复)
模型选型避坑指南：别让部署白费功夫 🚀 (6篇回复)
国产大模型卷出新高度？实测Qwen2.5-72B和DeepSeek-V3部署体验 (2篇回复)
模型性能别再随便调参了，这4个实战技巧能省你一周时间 🚀 (1篇回复)
模型黑盒别再忍，解释性研究是时候上车了 🚀 (3篇回复)
Agent开发避坑指南：从模型选型到部署的实战经验🚀 (1篇回复)
跑了20个代码模型后，我决定写这篇评测笔记 🧪 (1篇回复)
聊聊AI应用的落地变现：模型部署不是终点，是起点 (0篇回复)
模型解释性不是玄学，是工程落地前的必补课 🧠 (1篇回复)
实测5种推理加速方案：谁在降延迟，谁在吃显存？ (3篇回复)
多模型协作实战：别再单打独斗了，组队才叫真降本 🚀 (2篇回复)
大模型显存不够？这3个内存优化骚操作你试过吗？ (2篇回复)
玩模型不调参？分享我的模型微调踩坑与实战经验 🛠️ (1篇回复)
多模态大模型2024：从GPT-4V到开源生态，谁在真正落地？ (2篇回复)
聊聊AI基础设施：从模型训练到推理，你的架构踩过哪些坑？🚀 (2篇回复)
RAG实战踩坑总结：别让检索成为你AI的拖油瓶 🚀 (5篇回复)

页: 114 115 116 117 118 119 120 121 122 123 [124] 125 126 127 128 129 130 131 132 133

闲社's Archiver