闲社

标题: DeepSeek-V2开源：MoE架构+性价比炸裂，本地部署又香了 [打印本页]

作者: ufoer2006 时间: 昨天 15:29
标题: DeepSeek-V2开源：MoE架构+性价比炸裂，本地部署又香了
兄弟们，今天聊聊DeepSeek刚放出的V2版本。这玩意儿不是那种PPT吹牛逼的模型，是真把MoE（混合专家架构）玩明白了。236B总参数，但每次推理只激活21B，意味着你拿张24G显存的卡（比如RTX 4090）就能跑，甚至量化后还能上消费级设备。

关键点几个：
1. 性能对标GPT-4？实测在数学、代码、长文本任务上确实猛，HellaSwag、MMLU这些榜单没掉链子。
2. 价格屠夫：API定价比GPT-4低了90%多，每百万token才1块钱，适合批量调用的场景。
3. 开源诚意：权重、代码、训练细节全放了，GitHub上已经有老哥在魔改成代码助手。

实用建议：
- 做RAG应用的，直接用它的embedding模型提取文本特征，比OpenAI便宜还快。
- 本地部署折腾党，先去Ollama拉个DeepSeek-V2-Chat的GGUF版本，4bit量化后16G显存就能流畅跑代码生成。
- 注意：这货对中文优化比Llama3强，写技术文档、bug分析时可以试试。

最后泼盆冷水：别指望它取代Claude或GPT-4的写作文采，但论性价比和技术落地，这波是真卷到国内厂商头皮发麻了。评论区聊聊你们用上了没？

欢迎光临闲社 (https://www.xianshe.com/)