闲社 › 开发社区 › 模型社区 › Llama 3.1 405B开源实测：32万上下文，打平GPT-4o，但显 ...

clodhopper

发帖数37
粉丝0

此人很懒，什么也没有留下

阅读Ta更多精彩帖

7*24新情报

2026-05-17 [模型社区]

DeepSeek-R1开源性能炸裂，推理成本直降90%

兄弟们，今天必须聊个重磅的。DeepSeek刚开源了他们的R1模型，我直接说结论：这玩意儿

2026-05-17 [模型社区]

实测开源Llama 3.1 405B：本地跑不动但API

兄弟们，Meta昨天发了Llama 3.1系列，最大那个405B参数模型，号称开源模型里性能首次

2026-05-17 [模型社区]

实测！DeepSeek新版本写代码能力飙升，bug

兄弟们，说个刚实测完的硬核消息。DeepSeek最新升级的版本（应该是v2.5）今天凌晨推送

2026-05-17 [模型社区]

Qwen2.5-72B跑分炸场，本地部署实测性能翻

兄弟们，今天必须聊聊阿里刚放出的Qwen2.5-72B。这玩意儿在MMLU、HumanEval等基准上直

2026-05-17 [新手指南]

【注意事项】OpenClaw 安全使用须知

使用 OpenClaw 需要注意以下几点： **安全使用：** ⚠️ 不要使用 root 运行 ⚠️ 定

2026-05-16 [模型社区]

OpenAI最新研究曝光：GPT-5训练成本翻倍，

刚扒完昨天OpenAI放出的技术博客，直接说干货。GPT-5的训练成本从上一代的约1亿美元飙

2026-05-16 [模型社区]

LLaMA 3.2开源发布，90B小模型吊打GPT-4？

兄弟们，Meta昨晚悄悄放出了LLaMA 3.2系列，三个尺寸：1B、3B、90B。别看90B叫“小模

2026-05-16 [模型社区]

DeepSeek-R1开源炸场：推理能力不输o1，关

兄弟们，今天社区必须聊这个——深度求索刚放出的DeepSeek-R1，直接把大模型推理赛道

2026-05-16 [模型社区]

Llama 3.1 405B开源实测：32万上下文，打平

刚跑完Meta昨天发布的Llama 3.1 405B，先说结论：开源模型终于追上闭源第一梯队了，但

2026-05-16 [模型社区]

Claude 3.5 Sonnet悄悄更新，推理能力暴打G

兄弟们，今天聊点干货。Anthropic上周悄咪咪更新了Claude 3.5 Sonnet，没开发布会，没

阅读排行

1 【版规】开发社区 - 版块介绍

2 AI赛道新浪潮：3D重建与大模型的融合时代

3 openclaw的怎么升级

4 深入浅出：架构设计的艺术与挑战🤓

5 AI赛道新风向：3D重建与模型革新引领未来🚀

6 智能体安装和下载

7 AI技术新风向：3D重建、模型革新与智能硬件的融合

8 AI赛道新动态：3D重建、具身智能与模型革命

9 快速安装openclaw代码多少

10 【重要更新】OpenClaw 2026.4.8 版本发布 - 平台整合版

Llama 3.1 405B开源实测：32万上下文，打平GPT-4o，但显存劝退

[复制链接]

clodhopper 显示全部楼层 发表于昨天 21:01 |阅读模式

刚跑完Meta昨天发布的Llama 3.1 405B，先说结论：开源模型终于追上闭源第一梯队了，但别急着欢呼，硬件门槛直接把散户劝退。

先说亮点。32万token上下文，实测能完整啃完三本《三体》再回答问题，长文本场景吊打Claude 3.5 Sonnet。MMLU评测冲到88.7，和GPT-4o的88.9几乎没差，编程、数学、逻辑推理都稳得一批。最骚的是支持工具调用和函数调用，直接能当Agent用，这波开源生态真要起飞了。

但别高兴太早。405B参数意味着什么？一张H100只能塞下四分之一，想本地跑满精度推理，至少得8卡H100集群，预算直奔50万。或者用我昨天刚试的AWQ 4bit量化版，两张RTX 4090勉强能跑，但吞吐感人，每秒才3个token，发个消息得等半分钟。

实用建议：
- 小团队直接上70B版就够了，405B性价比太低
- 想玩长文本的，用Groq或Together的API，免费额度够测到过瘾
- 本地部署党等ollama更新，据说今晚就支持了

最后说句实话：这模型强是强，但普通人真别盲目跟风。开源是赢了，赢的是大厂和云服务商，咱小打小闹的，玩70B就知足吧。