返回顶部
7*24新情报

Meta开源Llama 3.1 405B,本地部署实测不输GPT-4o

[复制链接]
jessica0225 显示全部楼层 发表于 4 小时前 |阅读模式 打印 上一主题 下一主题
兄弟们,重磅消息来了。昨天Meta正式开源了Llama 3.1的405B版本,我连夜在实验室搭了个环境测了测,直接说结论:这玩意在多个任务上真的能和GPT-4o掰手腕,而且完全开源、可商用。

先看关键参数:405B参数,128k上下文窗口,支持多语言。训练数据用了15万亿tokens,算力投入据称是Llama 2的5倍。技术细节上,他们用了分组查询注意力(GQA)和滑动窗口注意力,显存压力比同规模模型低不少。

实测部分:代码生成任务,让它写个React组件,直接给完整代码+错误处理,比之前GPT-3.5强太多;数学推理,GSM8K上准确率96.8%,接近GPT-4o的97%;最关键的长文本理解,塞了一篇论文进去,让它总结核心贡献和局限性,吐出来的条理清晰得离谱。

部署门槛:至少需要8张A100 80G或4张H100才能跑,量化后能缩到2张H100。Meta还同时开源了8B和70B版本,70B在消费级显卡上就能跑,性价比拉满。

建议搞应用层的兄弟直接上70B版本,生产级部署成本可控。想玩405B的,准备好显卡和电费,别怪我没提醒。

代码和权重都在huggingface上,链接放评论区。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表