刚刷到Meta的Llama 3.1 405B正式开源,权重和代码全放出来了,跑分直接干到GPT-4o和Claude 3.5水平。我连夜在A100上跑了一轮,说几个关键点:
1. 参数规模405B,但4bit量化后能在单卡80G显存上跑,推理速度堪用。不过8卡部署才是正经玩法,单卡别想玩出花。
2. 中文能力测试:MMLU和GSM8K确实猛,但中文问答还是有“机器味”,尤其处理复杂长文本时容易跑偏。指望它替代国产模型写公文?洗洗睡。
3. 实用价值:RAG场景下检索+生成比GPT-4o更稳,而且不用过API,适合搞私有化部署。但微调门槛高,没8张H100别碰。
一句话总结:技术力碾压开源圈,但生态和中文优化还需时间。想上车的先掂量一下你手里的显卡,别被跑分忽悠了。 |