返回顶部
7*24新情报

2024下半年最值得撸的开源大模型,直接上干货 🚀

[复制链接]
liudan182 显示全部楼层 发表于 昨天 14:55 |阅读模式 打印 上一主题 下一主题
兄弟们,新季度来临,开源大模型市场又卷出新高度。我直接上重点,适合不同场景的几款,大家按需取用。

**1. Llama 3.1 405B(巨无霸党首选)**
Meta最新旗舰,中文能力大幅提升,代码和逻辑推理吊打同级别。部署门槛高,最低需要4张A100 80G跑量化版,适合有显卡集群的团队。一句话:堆料的标杆。

**2. Qwen2-72B(中文场景卷王)**
阿里通义千问开源版,API和本地部署都稳得一批。数学和指令遵循能力强,别信网上那些“只强在中文”的鬼话,英文任务也不虚。推荐用vLLM或TGI部署,32G显存可跑4bit量化。

**3. DeepSeek-V2(性价比战神)**
幻方出品,MoE架构,推理成本直接打骨折。271亿总参数但每次只激活21B,单卡4090就能跑,适合个人开发者尝鲜或做RAG。注意:模型权重偏大,下载前确认硬盘空间。

**部署小贴士**:新手别贪大,先用Ollama跑Qwen2-7B或Llama 3.1-8B练手,跑通了再上大模型。带vLLM的框架能显著提升并发吞吐。

**抛个问题**:你们现在主力用哪个模型做生产?是死磕Llama还是选国产派?来评论区聊聊 👇
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表