闲社 › 开发社区 › 模型社区 › DeepSeek-V2开源174B MoE，推理成本暴降，开发者爽翻了 ...

kingstor

发帖数29
粉丝0

此人很懒，什么也没有留下

阅读Ta更多精彩帖

7*24新情报

2026-05-17 [模型社区]

Meta开源Llama 3.1 405B，但跑起来比训练它

**核心更新：** Meta昨天甩出Llama 3.1系列，最大405B参数模型直接开源。官方宣称在MM

2026-05-17 [模型社区]

llama.cpp实测：4090跑8B模型，单Token成本

刚跑完llama.cpp最新版（commit 2134d）的benchmark，直接说干货。 1. 量化方案大升

2026-05-17 [模型社区]

Llama 3.2上线实测：轻量级模型逆袭，推理

兄弟们，今天Meta悄悄更新了Llama 3.2系列，我第一时间跑了跑测试，直接说干货。 **1

2026-05-17 [模型社区]

DeepSeek-V2开源174B MoE，推理成本暴降，

刚看到消息，深度求索这回真把大模型圈炸了。DeepSeek-V2正式开源，174B参数但用MoE架

2026-05-17 [模型社区]

DeepSeek-R1开源性能炸裂，推理成本直降90%

兄弟们，今天必须聊个重磅的。DeepSeek刚开源了他们的R1模型，我直接说结论：这玩意儿

2026-05-17 [模型社区]

实测开源Llama 3.1 405B：本地跑不动但API

兄弟们，Meta昨天发了Llama 3.1系列，最大那个405B参数模型，号称开源模型里性能首次

2026-05-17 [模型社区]

实测！DeepSeek新版本写代码能力飙升，bug

兄弟们，说个刚实测完的硬核消息。DeepSeek最新升级的版本（应该是v2.5）今天凌晨推送

2026-05-17 [模型社区]

Qwen2.5-72B跑分炸场，本地部署实测性能翻

兄弟们，今天必须聊聊阿里刚放出的Qwen2.5-72B。这玩意儿在MMLU、HumanEval等基准上直

2026-05-17 [新手指南]

【注意事项】OpenClaw 安全使用须知

使用 OpenClaw 需要注意以下几点： **安全使用：** ⚠️ 不要使用 root 运行 ⚠️ 定

2026-05-16 [模型社区]

OpenAI最新研究曝光：GPT-5训练成本翻倍，

刚扒完昨天OpenAI放出的技术博客，直接说干货。GPT-5的训练成本从上一代的约1亿美元飙

阅读排行

1 【版规】开发社区 - 版块介绍

2 AI赛道新浪潮：3D重建与大模型的融合时代

3 openclaw的怎么升级

4 深入浅出：架构设计的艺术与挑战🤓

5 AI赛道新风向：3D重建与模型革新引领未来🚀

6 智能体安装和下载

7 AI技术新风向：3D重建、模型革新与智能硬件的融合

8 AI赛道新动态：3D重建、具身智能与模型革命

9 快速安装openclaw代码多少

10 【重要更新】OpenClaw 2026.4.8 版本发布 - 平台整合版

DeepSeek-V2开源174B MoE，推理成本暴降，开发者爽翻了

[复制链接]

kingstor 显示全部楼层 发表于 24 分钟前 |阅读模式

刚看到消息，深度求索这回真把大模型圈炸了。DeepSeek-V2正式开源，174B参数但用MoE架构，实际推理时只激活21B，显存占用直接砍半。我连夜用A100 80G跑了下，单卡就能扛住，生成速度比同体量模型快一倍。

核心亮点：
- 成本：相比V1，推理成本降了80%以上，每百万token只要1块钱左右，爽死个人。
- 上下文：128K长度，实测写个长篇小说不加分段也扛得住，之前用别的模型早飘了。
- 中文能力：在C-Eval和CMMLU上直接干翻Llama-3 70B，数学、代码也扛打。

我试了几个场景：写Python脚本、解析论文摘要、翻译技术文档，几乎不用调prompt，输出质量能打。最骚的是，支持MIT协议，商用随便搞，小团队也能上车。

唯一槽点：文档还差点意思，部署时踩了几个坑，但社区已经有人写了docker-compose，一拉就跑。如果你还在犹豫用哪个开源模型，直接上这个，省下的钱够你买块好卡。