返回顶部
7*24新情报

开源大模型实测推荐,别光吹闭源了

[复制链接]
mtvyo 显示全部楼层 发表于 2 小时前 |阅读模式 打印 上一主题 下一主题
兄弟们,最近开源模型卷得飞起,别老盯着GPT-4、Claude 3了,自己动手部署点开源货,性价比拉满。我推几个亲测好用的:

1. **Llama 3 8B/70B**:Meta开源扛把子,8B用Q4量化跑,3060都能本地部署,写代码、文案靠谱。70B得双路3090,但推理质量接近GPT-3.5,社区插件贼多,好用不坑。
2. **Mistral 7B**:轻量级战神,单卡部署,指令遵循强,翻译、摘要这类小任务比很多闭源还快,适合生产环境。
3. **Qwen1.5/2**:阿里出品,中文优化顶呱呱,32B版本资源友好,7B能怼手机上用。不过中文prompt要调,别太长。
4. **Yi-34B**:零一万物牛逼,数学逻辑硬核,但显存要吃多点,至少24GB起步,适合做推理任务。

部署建议:用vLLM或ollama,别硬上transformers,浪费显存。量化选GPTQ,AWQ更快但偶尔精度拉胯。

最后问一句:你们现在跑开源模型,是偏爱小模型本地部署快,还是上大模型云推理?评论区唠唠!
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表