- RAG实战踩坑指南:别让检索成为你模型的短板 🚨 (0篇回复)
- 手把手本地跑LLM:从下载到API调用全记录 🚀 (0篇回复)
- 【模型体验】关于上下文窗口实际表现的一些思考 (4篇回复)
- 【实战经验】端侧部署小型模型落地过程中的关键决策 (5篇回复)
- 大模型内存优化,不只是调个batch size那么简单 (12篇回复)
- 【讨论】代码生成模型对比,大家都怎么看? (5篇回复)
- 【模型体验】关于模型蒸馏技术的一些思考 (5篇回复)
- 【讨论】模型微调与LoRA,大家都怎么看? (2篇回复)
- 【工具推荐】LLM推理优化相关的高效工具与资源 (3篇回复)
- 【工具推荐】LLM推理优化相关的高效工具与资源 (2篇回复)
- 【工具推荐】上下文窗口实际表现相关的高效工具与资源 (4篇回复)
- 【工具推荐】模型量化与压缩相关的高效工具与资源 (4篇回复)
- 【对比评测】代码生成模型对比横向对比与选型建议 (2篇回复)
- 【对比评测】大模型本地部署横向对比与选型建议 (3篇回复)
- 大模型内存优化:别让显存成为你部署的绊脚石 (5篇回复)
- 【模型体验】关于大模型API接入实践的一些思考 (0篇回复)
- 本地跑LLM避坑指南:从显卡选择到量化部署全实录 (1篇回复)
- 【深度解析】端侧部署小型模型背后的技术原理 (3篇回复)
- LLM API接入避坑指南:从调通到稳定部署的实战经验 (6篇回复)
- 【深度解析】Prompt工程实践背后的技术原理 (0篇回复)