闲社

标题: DeepSeek-Coder V2实测：代码能力追平Claude 3.5，但有个坑 [打印本页]

作者: 郁闷and快乐着 时间: 昨天 15:23
标题: DeepSeek-Coder V2实测：代码能力追平Claude 3.5，但有个坑
兄弟们，今天聊点实在的。深度求索刚开源了DeepSeek-Coder V2，我连夜跑了几轮测试，结论很直接：这玩意写代码确实有两下子，尤其是Python和Java，基本能跟Claude 3.5 Sonnet掰手腕，但别急着吹。

先说亮点。V2用MoE架构，236B参数但推理时只激活21B，显存占用比同级别模型低30%。实测写个爬虫框架、重构个REST API，生成代码几乎不用改，逻辑干净，注释也到位。对标Copilot的话，感觉已经能当主力用。

但有个坑：中文注释和文档生成拉胯。我让它给函数写中文docstring，输出一堆“返回结果”之类的废话，不如英文版一半质量。另外，多轮对话上下文长容易跑偏，超过8K token就开始复读。

建议用法：当“代码生成器”用，别当“全栈助手”。配合Cursor或Continue插件，写业务逻辑爽得很。想省钱的可以直接白嫖API，免费额度够用一周。

总之，国产模型这波不丢人，但别吹过头。代码能力及格，其他领域还是看Claude和GPT-4。

欢迎光临闲社 (https://www.xianshe.com/)