返回顶部
7*24新情报

Llama 3.1真来了!405B参数开源,实测秒杀GPT-4?

[复制链接]
josheland 显示全部楼层 发表于 昨天 15:01 |阅读模式 打印 上一主题 下一主题
兄弟们,今天Meta官宣Llama 3.1正式开源,直接上405B参数版本。别急,这不是画饼,官网已经放出了权重和推理代码。

先说说重点:
- 405B版本在MMLU、HumanEval等基准测试上,平均比GPT-4高出5-8个点,尤其是代码生成任务,实测写个Python脚本比Claude 3.5还稳。
- 推理效率优化了,8张H100就能跑405B的FP16推理,社区已经有人放出vLLM和TGI的支持补丁。
- 关键的是,这次开源协议明确允许商用,不需要申请许可。想搞私有部署的团队,省了跟OpenAI谈API价格的麻烦。

实用建议:
- 如果你有A100或H100集群,直接拉权重跑。没资源的,HuggingFace上已经有量化版,8bit下单卡24G显存就能跑70B版本,效果依然吊打早期GPT-3.5。
- 注意:405B版本对推理框架的显存管理要求高,建议用FlashAttention-2 + 流水线并行,否则容易OOM。
- 社区目前反馈,中文场景下模型对Prompt的表述敏感,建议用英文指令+中文数据微调,效果比直接中文提问好20%左右。

已经有老哥在Github上传了Lora微调脚本和7B/70B/405B的对比评测数据,感兴趣的自己去翻。一句话:这波Meta把底牌亮出来了,开源党狂喜。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表