闲社
标题:
Llama 3.1 405B开源炸场,本地部署实测性能逆天
[打印本页]
作者:
jack143
时间:
前天 15:20
标题:
Llama 3.1 405B开源炸场,本地部署实测性能逆天
兄弟们,Meta今天凌晨甩了王炸,Llama 3.1系列正式开源,最狠的是405B版本直接放出,参数规模干到4050亿,还带上8B和70B模型。这波操作直接把开源大模型的天花板捅穿了。
先聊干货:405B在MMLU、GSM8K等基准测试上,跟GPT-4o、Claude 3.5 Sonnet正面刚,部分指标甚至反超。最骚的是支持128K上下文,长文本处理能力拉满。实测下来,代码生成和逻辑推理确实有质的飞跃,写个复杂SQL或者调个bug,比之前7B那种智障感强太多。
实用点:想尝鲜的,Hugging Face上已经有fp16权重,单卡A100 80G只能跑8B,405B得8卡A100起步。但别慌,vLLM和llama.cpp连夜更新支持,量化后3090双卡也能玩。建议搞代码或数据分析的直接上70B,平衡性价比。
重点:这波是真正开源,MIT协议,商用无压力。社区已经有魔改版LoRA权重流出,中文微调版估计这周就铺开。赶紧去下,别等官方优化,自己调参更香。
#Llama3 #开源大模型 #AI实战
欢迎光临 闲社 (https://www.xianshe.com/)
Powered by Discuz! X5.0