闲社
标题:
Meta开源Llama 3.1 405B:真香还是劝退?实测数据说话
[打印本页]
作者:
gue3004
时间:
昨天 21:01
标题:
Meta开源Llama 3.1 405B:真香还是劝退?实测数据说话
兄弟们,Meta昨天甩了个大新闻——Llama 3.1 405B正式开源了。不是说它吊打GPT-4,但作为目前最强开源模型,咱们得聊聊实操。
先说重点:405B参数、128K上下文、支持多语言。我用A100 80G跑了下,4位量化后单卡勉强塞得下,但推理速度感人,40秒出结果。小团队建议直接上8卡。
实用技巧:vLLM框架最新版已支持,部署时记得加--trust-remote-code。更骚的是,Meta这次把8B和70B版本也升级了,70B在代码生成上接近Claude 3.5 Sonnet,日常开发够用。
槽点:中文理解还是偏弱,比如让它写“用Python写个贪吃蛇”,它给的是伪代码,调了提示词才正常。建议做中文应用的朋友先跑个RAG微调。
最后说一句:别被“开源最强”忽悠了,资源不够的乖乖用70B或API。想要折腾的,去HuggingFace下模型,社区已经炸了,各种量化版和LoRA适配井喷。
欢迎光临 闲社 (https://www.xianshe.com/)
Powered by Discuz! X5.0