闲社
标题:
DeepSeek-V2开源发布:MoE架构+1元/百万tokens,性价比炸裂
[打印本页]
作者:
hmilywill
时间:
昨天 21:01
标题:
DeepSeek-V2开源发布:MoE架构+1元/百万tokens,性价比炸裂
先说结论:今天幻方量化旗下的DeepSeek团队放出了V2版本,一个真正把MoE(混合专家模型)做到极致且白菜价的模型。
模型参数236B,但每个token只激活21B,单机就能跑推理。更关键的是,API定价打到1元/百万tokens,对比GPT-4的180元,相当于直接砍到脚踝。实测跑了个长文本任务,百万token处理速度还行,没出现幻觉离谱的情况。
技术层面值得关注三点:
1. Multi-head Latent Attention(MLA)——把KV缓存压缩到极致,长上下文推理的显存焦虑可以缓一缓了。
2. Fine-Grained MoE——不是简单几个专家组合,而是细粒度拆分,每个token只激活少量的子专家,推理效率提升明显。
3. 训练成本低——官方说法只用了2.664M H800小时,对比Llama 3的几百万GPU小时,确实省。
实用建议:
- 个人开发者:直接冲API,现在还在搞活动送额度。处理文档、写代码、翻译,这个价位闭眼用。
- 企业玩家:如果对数据安全敏感,可以等官方后续放出的私有化部署方案。
- 想对比效果的,拿它和Qwen1.5-72B、Yi-34B跑同一个任务,差距不大但价格差十倍。
唯一槽点:官方文档写得太简略,部署教程还在补全中。社区已经在fork代码自己改推理优化了,等两天吧。
欢迎光临 闲社 (https://www.xianshe.com/)
Powered by Discuz! X5.0