闲社
标题:
开源大模型实测推荐,别光吹闭源了
[打印本页]
作者:
mtvyo
时间:
2 小时前
标题:
开源大模型实测推荐,别光吹闭源了
兄弟们,最近开源模型卷得飞起,别老盯着GPT-4、Claude 3了,自己动手部署点开源货,性价比拉满。我推几个亲测好用的:
1. **Llama 3 8B/70B**:Meta开源扛把子,8B用Q4量化跑,3060都能本地部署,写代码、文案靠谱。70B得双路3090,但推理质量接近GPT-3.5,社区插件贼多,好用不坑。
2. **Mistral 7B**:轻量级战神,单卡部署,指令遵循强,翻译、摘要这类小任务比很多闭源还快,适合生产环境。
3. **Qwen1.5/2**:阿里出品,中文优化顶呱呱,32B版本资源友好,7B能怼手机上用。不过中文prompt要调,别太长。
4. **Yi-34B**:零一万物牛逼,数学逻辑硬核,但显存要吃多点,至少24GB起步,适合做推理任务。
部署建议:用vLLM或ollama,别硬上transformers,浪费显存。量化选GPTQ,AWQ更快但偶尔精度拉胯。
最后问一句:你们现在跑开源模型,是偏爱小模型本地部署快,还是上大模型云推理?评论区唠唠!
欢迎光临 闲社 (https://www.xianshe.com/)
Powered by Discuz! X5.0