闲社 › 开发社区 › 模型社区 › DeepSeek实测：千亿参数开源模型，推理爆发力惊人 ...

pippen2004

发帖数30
粉丝0

此人很懒，什么也没有留下

阅读Ta更多精彩帖

7*24新情报

2026-06-22 [技能分享]

【教程】headroom实战：用Python压缩LLM输

前言最近GitHub上有个项目headroom爆火，43K+ Star，核心功能就一个：在内容到达LLM

2026-06-22 [资源工具]

【AI工具】Cline开源Agent SDK解析：从插件

【AI工具】Cline开源Agent SDK深度解析：从VS Code插件到可编程AI Agent平台的进化之

2026-06-22 [开发社区]

【开发】Turso：Rust重写SQLite，进程内数

引言：当数据库从共享实例走向一人一库最近 GitHub Trending 上出现了一个有意思的

2026-06-22 [模型社区]

【大模型】刚刚！OpenAI发布LifeSciBench：

引言：当AI走出聊天框，走进实验室 6月17日，OpenAI发布了一个可能改变AI科研范式的

2026-06-22 [新手指南]

【新手教程】Docker Compose一键部署Dify A

前言 Dify 是当前最热门的开源 AI 应用开发平台之一，支持可视化编排 Agent 工作流、

2026-06-22 [开发社区]

【开发】Penpot 52K星背后的开源设计革命：

引言：设计工具正在被重新定义过去十年，设计工具市场被Figma、Sketch等闭源产品主

2026-06-21 [模型社区]

【大模型】刚刚！OpenAI企业版上线AI成本追

引言：AI投入黑洞，终于有解了？ 6月18日，OpenAI正式发布了两项企业级重磅功能——

2026-06-21 [模型社区]

聊聊Kubernetes上部署LLM的4个关键资源分配

朋友们好，今天来聊聊AI基础设施搭建的一个硬核问题：在K8s上跑大模型，资源分配真的

2026-06-21 [模型社区]

【讨论】Claude vs GPT vs Gemini，大家都

分享一个Claude vs GPT vs Gemini的实战案例：我们团队最近在做模型选型，对比了多

2026-06-21 [技能分享]

【教程】OpenMontage开源AI视频制作系统部

【教程】OpenMontage开源AI视频制作系统部署指南：12条流水线从零制作专业视频 [hr]

阅读排行

1 【版规】开发社区 - 版块介绍

2 AI赛道新浪潮：3D重建与大模型的融合时代

3 AI技术新风向：3D重建、模型革新与智能硬件的融合

4 深入浅出：架构设计的艺术与挑战🤓

5 AI赛道新风向：3D重建与模型革新引领未来🚀

6 整理了一些学习资料

7 整理了一些学习资料

8 分享一些实用的开发工具

9 分享一些实用的脚本工具

10 推荐几个好用的软件资源

DeepSeek实测：千亿参数开源模型，推理爆发力惊人

[复制链接]

pippen2004 显示全部楼层 发表于昨天 15:02 |阅读模式

最近社区里不少兄弟在讨论DeepSeek，我拿它跑了几个典型任务，说说真实感受。DeepSeek是深度求索推出的千亿参数级别大模型，基础版671B参数，MoE架构，激活参数约37B。这货最亮眼的地方在推理和代码生成上。

我测试了一个复杂数学推理题——“证明质数无穷多”的变种，DeepSeek直接给出三步推导，逻辑链清晰，没有废话。对比Llama 3 70B，它在多步推理中更容易断片。代码方面，我用它写个Python爬虫，要求处理反爬和异步请求，DeepSeek直接输出完整代码，bug极少，甚至自动加上了错误重试机制。这点在开发效率上很实用。

还有个惊喜是长上下文支持，128K token，我丢了一整本技术手册（约80K token）进去问细节，它还能准确定位答案，没出现幻觉。不过，它在创意写作上稍弱，比如写诗或故事，风格偏干硬。另外，中文环境下，一些网络梗和口语化表达理解不够，可能是训练数据偏向正式文本。

总的来说，如果你是搞LLM应用开发或需要代码/数学助手，DeepSeek值得一试。它在GitHub上开源，社区版支持多平台部署，门槛不高。建议搭配vLLM或llama.cpp使用，推理速度能压榨到30 tokens/s以上。