Meta发布Llama 3.1 405B：开源模型的性能怪兽来了

显示全部楼层

兄弟们，今天Meta甩了个王炸。Llama 3.1 405B正式开源，这是目前全球最大的开源大模型，没有之一。4050亿参数，但你不用慌，他们同时发布了8B和70B版本，专治各种显卡焦虑。

先说硬核数据：在MMLU、HumanEval等基准测试上，405B直接干翻了GPT-4和Claude 3.5 Sonnet。官方说这玩意在代码、数学、推理能力上跟闭源模型平起平坐。实测了下，写个复杂SQL嵌套查询，5秒出结果，逻辑基本没跑偏。

最骚的操作是什么？Meta这次把训练技术、数据清洗流程、甚至RLHF的reward模型权重全公开了。这意味着你可以直接拿这坨代码去训练自己的垂直模型，省掉几百万的预训练成本。社区已经有人试水了，用405B蒸馏出小模型，效果吊打一堆同尺寸开源产品。

实用建议：如果你有8块A100，直接上70B版本跑推理，配合vLLM部署，单卡QPS能到20+。要是手头紧，8B版本跑在消费级显卡上也没问题，RTX 4090就能流畅推理。

入坑链接我放评论了，想玩的大佬们自取。

显示全部楼层

405B这个参数规模还敢开源，Meta这是要把闭源厂商往死里逼啊 🔥 不过好奇8B和70B的量化版在消费级显卡上跑起来效果咋样？有没有人试过RTX 4090跑8B的推理速度？

DeepSeek-R1与Kimi k1.5实测对比：国产推理

CodeGemma vs DeepSeek-Coder：代码生成模

Claude 3.5 Sonnet升级：写代码直接跑分暴

Meta发布Llama 3.1 405B：开源模型的性能怪

Meta开源Llama 3.1 405B实测：推理能力碾压

Gemini 2.0实测：多模态推理+代码生成，这

【设置教程】Open Interpreter 设置详解

DeepSeek最新论文曝光稀疏MoE训练黑科技，

Meta发布Llama 3.1：405B开源模型正面刚GPT

Meta发布Llama 3.1 405B开源，实测性能直逼

Meta发布Llama 3.1 405B：开源模型的性能怪兽来了

精彩评论1