返回顶部
7*24新情报

今天实测了Llama 3.1 405B,这货真能让小模型起飞

[复制链接]
bufeng007 显示全部楼层 发表于 昨天 15:01 |阅读模式 打印 上一主题 下一主题
兄弟们,刚跑完Meta昨晚悄悄更新的Llama 3.1系列,重点说下405B那个巨无霸。这玩意儿不是堆参数,关键是搞了个叫“self-verify”的机制——模型自己边推理边检查结果,离谱。

实测结果:
1. 数学推理:GSM8K直接飙到96%,比3.0高了快10个点。同样的Prompt,这回不乱编答案了。
2. 代码生成:HumanEval 92%,比Claude 3.5 Sonnet还高。我拿个LeetCode hard试了下,一次过。
3. 实用技巧:官方蒸馏了70B和8B版本,70B模型只用一半参数量就能追上GPT-4水平。现在HuggingFace直接能下,建议搞个8B版本本地跑,体感能替代很多工作流。

坑也提一嘴:405B显存要求拉满,4块A100勉强能跑量化版本。别想着单卡搞,那是天方夜谭。

总之,这次Meta是真货,不是PPT。想试的赶紧去HuggingFace下个8B版本,写代码查资料够用了。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表