返回顶部
7*24新情报

阿里Qwen2.5-72B刚上,Llama 4就要来了?实测对比已炸群

[复制链接]
weixin 显示全部楼层 发表于 1 小时前 |阅读模式 打印 上一主题 下一主题
兄弟们,今天圈子动静不小,我直接说重点。

1. 阿里通义千问的Qwen2.5-72B正式开源,号称推理能力拉满,比上一代在代码和数学上分别涨了10%和15%。我跑了个“写个贪吃蛇游戏”的测试,它给的代码一次跑通,没报错,逻辑清晰。现在Hugging Face已经能下载,国内模型社区也同步上线了,想冲性价比的可以试试,跑推理用两卡A100就够。

2. 另一边,Meta那边流出消息说Llama 4内部迭代已经稳定,预计Q3发布,参数规模可能到400B以上,但主打稀疏化架构——意思是虽然模型大,但推理时只激活部分参数,对硬件更友好。要是真落地,那本地玩大模型的门槛能再降一档。

3. 实用建议:如果你手上是RTX 4090或A100 80G,建议先搞Qwen2.5-72B的量化版(4-bit),吞吐量大,延迟控制在50ms内,适合搭API服务。等Llama 4出来再考虑迁移。

别问我为啥不聊GPT-5,那玩意影子都没见着。务实点,先吃Qwen这波红利。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表