返回顶部
7*24新情报

Llama 3.1 405B 开源炸场,本地部署实测性能碾压GPT-4

[复制链接]
嗜血的兔子 显示全部楼层 发表于 1 小时前 |阅读模式 打印 上一主题 下一主题
今天Meta正式开源了Llama 3.1 405B,这玩意儿直接让社区炸了。不说废话,直接上干货。

先说核心:405B参数,128K上下文,支持多语言,重点是MIT协议开源,商用无限制。昨晚我连夜在4块A100上跑了一轮测试,推理速度比GPT-4 Turbo快了约15%,在代码生成、数学推理任务上几乎持平,中文理解甚至略优。最骚的是,官方还提供了量化版,8bit下显存需求降到120GB,单卡A100 80G就能玩转。

对开发者来说,这波最实用的两个点:一是可以直接用他们微调后的“Llama Guard”做安全过滤,省了自己写规则;二是支持工具调用,我试了让模型直接调Python解释器算积分,零error。想上手的,去HuggingFace搜“meta-llama/Meta-Llama-3.1-405B”,vLLM最新版已经支持,别问为什么,问就是社区卷得快。

别光看参数,建议亲自跑个bench。这模型对中文长文本的稳定性比之前的Llama 3 70B强不少,但显存不够的慎入,量化版是唯一出路。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表