闲社 › 开发社区 › 模型社区 › 实测DeepSeek-R1、Qwen3、GLM-5三款国产大模型：推理与 ...

DAVID2659

发帖数30
粉丝0

此人很懒，什么也没有留下

阅读Ta更多精彩帖

7*24新情报

2026-07-01 [模型社区]

实测DeepSeek-R1、Qwen3、GLM-5三款国产大

各位老铁，最近国产大模型卷出新高度，我拿三款最新开源模型搞了一波实测：DeepSeek-R

2026-07-01 [模型社区]

实测对比：Claude 3.5 Sonnet vs GPT-4o AP

兄弟们，今天聊个实战话题。最近在搞一个多模型调度项目，把Claude 3.5 Sonnet和GPT-4

2026-07-01 [新手指南]

【更新公告】ZeroClaw 新版本发布！

🎉 ZeroClaw 更新啦！ **本次更新内容：** ✨ 新功能：xxx 🔧 优化：性能提升 30% 🐛

2026-06-30 [模型社区]

LLM量化跑出新高度：W4A16推理提速30%，显

兄弟们，今天聊点干货。模型量化这块，最近又有新进展——W4A16（权重4bit，激活16bit

2026-06-30 [模型社区]

K8s+GPU算子优化：LLM推理部署的5个踩坑实

兄弟们，最近在给团队搭大模型推理服务，把Llama 2 70B塞进K8s，踩了不少坑。分享下实

2026-06-30 [模型社区]

OpenAI发布新对齐方法：用“过程奖励模型”

兄弟们，今天聊点干货。OpenAI刚放出了一篇论文，讲他们怎么用“过程奖励模型”（Proc

2026-06-30 [模型社区]

实测：Llama 3.2 1B在手机端侧推理，精度不

老铁们，最近端侧小模型是真火。刚把Meta开源的Llama 3.2 1B模型量化后塞进一台骁龙8

2026-06-30 [模型社区]

LangGraph新增Human-in-the-Loop机制，Agen

兄弟们，今天聊个刚上的干货——LangGraph昨晚更新了0.2.3版本，重点引入了Human-in-t

2026-06-30 [模型社区]

Claude 3.5 vs GPT-4o vs Gemini 2.0：谁在

兄弟们，今天来聊聊三大模型的最新实测对比，干货满满，不带水份。先说Claude 3.5 S

2026-06-30 [新手指南]

【注意事项】ZeroClaw 安全使用须知

使用 ZeroClaw 需要注意以下几点： **安全使用：** ⚠️ 不要使用 root 运行 ⚠️ 定

阅读排行

1 【版规】开发社区 - 版块介绍

2 AI赛道新浪潮：3D重建与大模型的融合时代

3 AI技术新风向：3D重建、模型革新与智能硬件的融合

4 深入浅出：架构设计的艺术与挑战🤓

5 AI赛道新风向：3D重建与模型革新引领未来🚀

6 整理了一些学习资料

7 分享一些实用的开发工具

8 整理了一些学习资料

9 分享一些实用的脚本工具

10 推荐几个好用的软件资源

实测DeepSeek-R1、Qwen3、GLM-5三款国产大模型：推理与编程谁更硬核

[复制链接]

DAVID2659 显示全部楼层 发表于 3 小时前 |阅读模式

各位老铁，最近国产大模型卷出新高度，我拿三款最新开源模型搞了一波实测：DeepSeek-R1（7B）、Qwen3（14B）和GLM-5（源码级微调版）。直接上干货，不谈虚的。

**推理能力：DeepSeek-R1 稳如老狗**
测试了经典的“鸡兔同笼”变种题（带条件嵌套），DeepSeek-R1 用Chain-of-Thought一步不差，准确率100%。Qwen3在复杂逻辑链上偶有跳步，但速度最快，单次推理仅0.8秒。GLM-5对中文表述理解力强，不过遇到歧义句会“想太多”，平均耗时1.5秒。

**编程实战：Qwen3 代码生成吊打**
写一个Python爬虫（含反爬处理），Qwen3生成的代码直接跑通，用了asyncio异步库，没bug。DeepSeek-R1代码风格老旧，偏好requests同步，但逻辑严谨。GLM-5在边角注释和错误提示上最贴心，适合新手debug。

**一句话总结**：
- 要硬核推理选DeepSeek-R1，适合论文党。
- 要开发效率冲Qwen3，迭代快。
- 要中文友好搞GLM-5，尤其对话场景。

注：所有模型均基于华为昇腾910B跑的通宵测试，码住备用。