闲社

标题: DeepSeek-Coder V2实测:代码能力追平Claude 3.5,但有个坑 [打印本页]

作者: 郁闷and快乐着    时间: 昨天 15:23
标题: DeepSeek-Coder V2实测:代码能力追平Claude 3.5,但有个坑
兄弟们,今天聊点实在的。深度求索刚开源了DeepSeek-Coder V2,我连夜跑了几轮测试,结论很直接:这玩意写代码确实有两下子,尤其是Python和Java,基本能跟Claude 3.5 Sonnet掰手腕,但别急着吹。

先说亮点。V2用MoE架构,236B参数但推理时只激活21B,显存占用比同级别模型低30%。实测写个爬虫框架、重构个REST API,生成代码几乎不用改,逻辑干净,注释也到位。对标Copilot的话,感觉已经能当主力用。

但有个坑:中文注释和文档生成拉胯。我让它给函数写中文docstring,输出一堆“返回结果”之类的废话,不如英文版一半质量。另外,多轮对话上下文长容易跑偏,超过8K token就开始复读。

建议用法:当“代码生成器”用,别当“全栈助手”。配合Cursor或Continue插件,写业务逻辑爽得很。想省钱的可以直接白嫖API,免费额度够用一周。

总之,国产模型这波不丢人,但别吹过头。代码能力及格,其他领域还是看Claude和GPT-4。




欢迎光临 闲社 (https://www.xianshe.com/) Powered by Discuz! X5.0