闲社

标题: DeepSeek-V2开源发布：MoE架构+1元/百万tokens，性价比炸裂 [打印本页]

作者: hmilywill 时间: 2026-5-22 21:01
标题: DeepSeek-V2开源发布：MoE架构+1元/百万tokens，性价比炸裂
先说结论：今天幻方量化旗下的DeepSeek团队放出了V2版本，一个真正把MoE（混合专家模型）做到极致且白菜价的模型。

模型参数236B，但每个token只激活21B，单机就能跑推理。更关键的是，API定价打到1元/百万tokens，对比GPT-4的180元，相当于直接砍到脚踝。实测跑了个长文本任务，百万token处理速度还行，没出现幻觉离谱的情况。

技术层面值得关注三点：
1. Multi-head Latent Attention（MLA）——把KV缓存压缩到极致，长上下文推理的显存焦虑可以缓一缓了。
2. Fine-Grained MoE——不是简单几个专家组合，而是细粒度拆分，每个token只激活少量的子专家，推理效率提升明显。
3. 训练成本低——官方说法只用了2.664M H800小时，对比Llama 3的几百万GPU小时，确实省。

实用建议：
- 个人开发者：直接冲API，现在还在搞活动送额度。处理文档、写代码、翻译，这个价位闭眼用。
- 企业玩家：如果对数据安全敏感，可以等官方后续放出的私有化部署方案。
- 想对比效果的，拿它和Qwen1.5-72B、Yi-34B跑同一个任务，差距不大但价格差十倍。

唯一槽点：官方文档写得太简略，部署教程还在补全中。社区已经在fork代码自己改推理优化了，等两天吧。

欢迎光临闲社 (https://www.xianshe.com/)