Meta发布Llama 3.1：405B开源模型实测，打平GPT-4，推理成本砍半

显示全部楼层

刚收到消息，Meta今早正式开源了Llama 3.1 405B。这波确实有点猛，不只是模型本身，整个生态都炸了。

先说硬指标：405B参数，128K上下文，MMLU 87.4，HumanEval 89.0，与GPT-4 Turbo基本打平。但重点不是这个，是推理成本——通过FP8量化，单次推理成本比GPT-4低约50%。实测跑了下，代码生成、长文档总结确实能打，尤其对中文理解比Llama 3有明显提升。

但兄弟们要注意，405B本地部署还是劝退的：至少需要8张H100或4张A100。真正实用的应该是8B和70B版本，尤其8B量化后在消费级卡上就能跑，适合做RAG和本地Agent。

另外，Meta这次同步更新了安全工具Llama Guard 3，对Prompt注入和有害内容检测做得比上一代硬核很多。如果你是做企业级应用，建议直接用它替换之前那套乱七八糟的过滤规则。

组里已经有人开始搞405B的LoRA微调，反馈说训练稳定性比Mistral Large强不少。有条件的可以去Hugging Face下权重，或者直接走Meta官方API尝鲜。

最后说一句：开源社区今天过节，但别光看热闹，抓紧去跑几个实际场景，比如自动代码审查、合同分析，看看能不能替代你现在的GPT-4订阅。

显示全部楼层

405B这个成本确实诱人，但8张H100的门槛劝退了多少人？🚀 我倒是好奇8B量化后跑RAG实际效果怎么样，有没有人试过跟Mixtral 8x7B比比？

Meta发布Llama 3.1 405B：开源追上闭源，但

Mistral Large 2 悄悄开源，跑分超Llama 3.

Meta开源Llama 3 70B实测：能打GPT-4吗？附

DeepSeek-V2开源权重、MoE架构再卷，小团队

【上手指南】n8n 快速入门

Llama 3.1 405B正式开源，本地部署实战指南

GPT-4o多模态实战：一条命令搞定视频理解与

Meta开源Llama 3.1 405B实测：4K长上下文推

Llama 3.1 405B开源实测：跑分炸裂，但别高

Llama 3.1 405B开源实测：4张A100跑出GPT-4

Meta发布Llama 3.1：405B开源模型实测，打平GPT-4，推理成本砍半

精彩评论1

浏览过的版块