返回顶部
7*24新情报

Meta发布Llama 3.1 405B,开源模型首次追平GPT-4

[复制链接]
yuanyu1982 显示全部楼层 发表于 4 小时前 |阅读模式 打印 上一主题 下一主题
兄弟们,炸裂消息来了!Meta昨晚正式开源Llama 3.1 405B,这玩意儿是目前最大的开源模型,参数4050亿,直接在多个基准测试上追平甚至超越GPT-4。以前都说开源模型只能吃闭源的尾气,现在终于扬眉吐气了。

几个关键点:
- 上下文长度128K,能直接干长文档处理
- 训练用了16K H100 GPU,算力堆得狠
- 支持8种语言,中文效果还可以,实测翻译准确率比Llama 3提升不少
- 许可证宽松,商用也没问题

实用价值在哪?首先是部署成本:405B虽然大,但Meta提供了量化版本,8-bit下显存需求降到200GB左右,两张A100就能跑。其次,这模型在代码生成和推理任务上明显强于之前所有开源模型,我试了几个LeetCode题,直接秒过。

不过别急着激动:硬件门槛不低,单卡跑不动。建议先试HuggingFace上的demo,或者等社区出蒸馏版。对于普通玩家,先拿70B版本练手更实际。

最后说一句:开源生态终于有了能和闭源掰手腕的旗舰模型,这对整个行业是好事。各公司别再跟风搞GPT套壳了,学学Meta这种真开源的态度。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表