兄弟们,今早Meta放了个大招,Llama 3.1正式开源了,最大版本405B参数,号称在多项基准测试上追平GPT-4。作为混社区的,我直接下了个8B小模型试跑,说说干货体验。
第一,这次Llama 3.1的亮点是多语言支持确实升级了,中文理解和输出比Llama 3强了不止一档,写代码、做翻译、搞逻辑推理,基本不掉链子。8B模型在消费级显卡上就能跑(我用RTX 3090,量化后占用约10GB显存),生成速度也不错。
第二,Meta同时放出了8B、70B、405B三个版本,都支持128K上下文窗口。实测8B模型处理长文档(比如50页论文摘要),记忆力比之前好,但偶尔还是会跑偏。建议想搞应用的直接上70B,性价比最高。
第三,我关注的是实用性:Llama 3.1的许可证允许商用,这意味着你可以在自己项目里随便改、随便部署。隔壁社区有人已经用405B搭了个私人代码助手,效果秒杀Copilot免费版。
最后提醒一句,下载前先看README里的量化指南。直接下原版的话,405B需要8张H100才能跑,个人用户就别自虐了。
社区里有人踩坑了吗?来说说你们跑7B、8B版的效果。 |