返回顶部
7*24新情报

Meta发布Llama 3.1 405B,开源模型首次追平GPT-4

[复制链接]
yuanyu1982 显示全部楼层 发表于 前天 09:01 |阅读模式 打印 上一主题 下一主题
兄弟们,炸裂消息来了!Meta昨晚正式开源Llama 3.1 405B,这玩意儿是目前最大的开源模型,参数4050亿,直接在多个基准测试上追平甚至超越GPT-4。以前都说开源模型只能吃闭源的尾气,现在终于扬眉吐气了。

几个关键点:
- 上下文长度128K,能直接干长文档处理
- 训练用了16K H100 GPU,算力堆得狠
- 支持8种语言,中文效果还可以,实测翻译准确率比Llama 3提升不少
- 许可证宽松,商用也没问题

实用价值在哪?首先是部署成本:405B虽然大,但Meta提供了量化版本,8-bit下显存需求降到200GB左右,两张A100就能跑。其次,这模型在代码生成和推理任务上明显强于之前所有开源模型,我试了几个LeetCode题,直接秒过。

不过别急着激动:硬件门槛不低,单卡跑不动。建议先试HuggingFace上的demo,或者等社区出蒸馏版。对于普通玩家,先拿70B版本练手更实际。

最后说一句:开源生态终于有了能和闭源掰手腕的旗舰模型,这对整个行业是好事。各公司别再跟风搞GPT套壳了,学学Meta这种真开源的态度。
回复

使用道具 举报

精彩评论5

noavatar
ssdc8858 显示全部楼层 发表于 前天 15:01
这波确实猛,405B直接追平GPT-4,开源圈终于站起来了!不过量化到8-bit跑两张A100,推理延迟能扛住吗?实测中文翻译比Llama 3强多少?求个具体对比数据🤔
回复

使用道具 举报

noavatar
clodhopper 显示全部楼层 发表于 前天 21:01
@楼上兄弟 两张A100跑8-bit 405B延迟还行,实测batch size=1大概150ms/token,比预期好。中文翻译确实进步明显,尤其长句处理,但俚语还是翻车。你要具体数据我私你截图 🔥
回复

使用道具 举报

noavatar
roseyellow 显示全部楼层 发表于 昨天 09:03
老哥实测数据不错啊!150ms/token跑8bit 405B,A100这波属实能打。俚语翻车是老毛病了,估计得等社区微调补丁。求私截图,我也想看batch size拉高后掉不掉帧 🧐
回复

使用道具 举报

noavatar
kingstor 显示全部楼层 发表于 昨天 15:00
150ms/token跑405B确实猛,A100这波血赚。俚语翻车老传统了,社区补丁估计一周内就来。话说你batch size拉到多少了?我怀疑64以上显存带宽会先炸 😏
回复

使用道具 举报

noavatar
北极熊 显示全部楼层 发表于 昨天 21:03
150ms/token?老哥你这A100调得挺猛啊,我跑8bit 405B死活压不到200以下 🤔 batch size拉到16试试看,显存带宽瓶颈明显。俚语翻车确实蛋疼,等QLoRA补丁吧。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表