闲社 › 开发社区 › 模型社区 › DeepSeek-V2开源：MoE架构+性价比炸裂，本地部署又香了 ...

ufoer2006

发帖数2
粉丝0

此人很懒，什么也没有留下

Llama-3-70B刚出就有人跑出SOTA了？我试了一下确实牛逼 ...

阅读Ta更多精彩帖

7*24新情报

2026-05-25 [模型社区]

DeepSeek最新论文曝光稀疏MoE训练黑科技，

刚刷完DeepSeek凌晨放出的技术报告，说几个干货点，不整虚的。 1. 核心改进：提出了

2026-05-25 [模型社区]

Meta发布Llama 3.1：405B开源模型正面刚GPT

兄弟们，今天Meta终于把Llama 3.1系列放出来了。最大的看点是那个405B参数的版本，号

2026-05-25 [模型社区]

Meta发布Llama 3.1 405B开源，实测性能直逼

兄弟们，今天Meta放了个大招，Llama 3.1 405B正式开源了。这是目前最大的开源模型，参

2026-05-25 [模型社区]

Llama 3.1 405B开源实测：70亿参数推理优化

兄弟们，今天Meta放了个大招，Llama 3.1 405B正式开源了。这玩意儿不是噱头，我连夜跑

2026-05-25 [模型社区]

DeepSeek-V2开源，国产MoE模型性价比拉满

老铁们，今天社区里聊得最多的就是DeepSeek开源的V2模型。这玩意儿是MoE架构，参数236

2026-05-25 [模型社区]

今天实测：Meta Llama 3.1 405B本地跑通了

兄弟们，今天搞了个大活。Meta刚放出的Llama 3.1 405B，号称开源最强，我直接上了双路

2026-05-25 [模型社区]

Claude 3.5 Sonnet性能炸场，推理任务吊打G

兄弟们，今早看到Anthropic悄悄放出了Claude 3.5 Sonnet的更新，直接上干货：代码生成

2026-05-25 [模型社区]

Llama 3.1 405B 开源炸场，本地部署还香不

刚刷到 Meta 放出的 Llama 3.1 405B 正式开源，参数 4050 亿，号称最强开源模型，直接

2026-05-25 [模型社区]

Meta发布Llama 3.1 405B开源，实测推理能力

刚刷到Meta官宣，Llama 3.1系列正式开源，重点是那个405B参数版本。别急着喊“又一个

2026-05-25 [模型社区]

Llama-3-70B刚出就有人跑出SOTA了？我试了

兄弟们，Meta昨天刚放出的Llama-3-70B，社区已经有人整活了。不是开源模型嘛？有人直

阅读排行

1 【版规】开发社区 - 版块介绍

2 AI赛道新浪潮：3D重建与大模型的融合时代

3 深入浅出：架构设计的艺术与挑战🤓

4 AI赛道新风向：3D重建与模型革新引领未来🚀

5 openclaw的怎么升级

6 AI技术新风向：3D重建、模型革新与智能硬件的融合

7 智能体安装和下载

8 AI赛道新动态：3D重建、具身智能与模型革命

9 整理了一些学习资料

10 分享一些实用的脚本工具

DeepSeek-V2开源：MoE架构+性价比炸裂，本地部署又香了

[复制链接]

ufoer2006 显示全部楼层 发表于昨天 15:29 |阅读模式

兄弟们，今天聊聊DeepSeek刚放出的V2版本。这玩意儿不是那种PPT吹牛逼的模型，是真把MoE（混合专家架构）玩明白了。236B总参数，但每次推理只激活21B，意味着你拿张24G显存的卡（比如RTX 4090）就能跑，甚至量化后还能上消费级设备。

关键点几个：
1. 性能对标GPT-4？实测在数学、代码、长文本任务上确实猛，HellaSwag、MMLU这些榜单没掉链子。
2. 价格屠夫：API定价比GPT-4低了90%多，每百万token才1块钱，适合批量调用的场景。
3. 开源诚意：权重、代码、训练细节全放了，GitHub上已经有老哥在魔改成代码助手。

实用建议：
- 做RAG应用的，直接用它的embedding模型提取文本特征，比OpenAI便宜还快。
- 本地部署折腾党，先去Ollama拉个DeepSeek-V2-Chat的GGUF版本，4bit量化后16G显存就能流畅跑代码生成。
- 注意：这货对中文优化比Llama3强，写技术文档、bug分析时可以试试。

最后泼盆冷水：别指望它取代Claude或GPT-4的写作文采，但论性价比和技术落地，这波是真卷到国内厂商头皮发麻了。评论区聊聊你们用上了没？