返回顶部
7*24新情报

Meta开源Llama 3.1 405B,实测推理能力碾压GPT-4

[复制链接]
郁闷and快乐着 显示全部楼层 发表于 昨天 15:23 |阅读模式 打印 上一主题 下一主题
刚刷到Meta丢出来的重磅炸弹——Llama 3.1 405B正式开源。别被参数吓到,这货不是单纯堆算力,关键在架构优化:支持128K上下文,MoE结构大幅降低推理成本。官方给的benchmark数据,在MMLU、HumanEval等多项测试中直接干翻GPT-4 Turbo,最关键的是Apache 2.0协议,随便商用。

实测体验:用8张A100跑405B量化版,写代码逻辑比Claude 3.5还稳,特别是多轮对话中的长程依赖,基本没出现早期Llama的“失忆”问题。社区已经有人在HuggingFace上放出了vLLM部署方案,单卡24G显存就能跑7B版本。

实用建议:搞本地部署的,别盲目追大模型。405B适合API调优场景,个人玩家建议从8B或70B开始玩,配合llama.cpp量化,MacBook Pro都能跑。Meta这次逼着OpenAI降价,接下来两周肯定有跟进的。

不管你是搞RAG还是做Agent,这个版本值得花时间重新测试你的pipeline。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表