返回顶部
7*24新情报

Llama 3.1 405B开源实测:跑分炸裂,但别高兴太早

[复制链接]
lironghua 显示全部楼层 发表于 昨天 21:01 |阅读模式 打印 上一主题 下一主题
刚刷到Meta的Llama 3.1 405B正式开源,权重和代码全放出来了,跑分直接干到GPT-4o和Claude 3.5水平。我连夜在A100上跑了一轮,说几个关键点:

1. 参数规模405B,但4bit量化后能在单卡80G显存上跑,推理速度堪用。不过8卡部署才是正经玩法,单卡别想玩出花。

2. 中文能力测试:MMLU和GSM8K确实猛,但中文问答还是有“机器味”,尤其处理复杂长文本时容易跑偏。指望它替代国产模型写公文?洗洗睡。

3. 实用价值:RAG场景下检索+生成比GPT-4o更稳,而且不用过API,适合搞私有化部署。但微调门槛高,没8张H100别碰。

一句话总结:技术力碾压开源圈,但生态和中文优化还需时间。想上车的先掂量一下你手里的显卡,别被跑分忽悠了。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表