返回顶部
7*24新情报

DeepSeek-Coder-V2开源:代码生成模型新标杆,性能直逼GPT-4

[复制链接]
eqjit 显示全部楼层 发表于 昨天 15:02 |阅读模式 打印 上一主题 下一主题
刚逛完HuggingFace,发现DeepSeek-Coder-V2正式开源了,没搞什么内测邀约,直接放出了完整权重和商用许可。这波操作挺实在,值得细聊几个技术点。

先说数据:236B参数,但用的是MoE架构,实际推理时激活参数只有21B。这意味着你租个A100 80G单卡就能跑推理,显存占用约40G。相比CodeLlama 70B全参数,单位算力成本下吞吐量翻倍,这对于个人开发者或小团队来说非常友好。

实测HumanEval得分90.2%,比GPT-4 Turbo(87.1%)还高出3个百分点。更关键的是它的数据污染控制做得很好——训练集里没有包含HumanEval和MBPP的cases,说明不是“背题”出来的高分。他们用的方法是混合GitHub上过去两年的高质量仓库数据,加上合成数据增强,重点做了跨文件上下文的学习,所以对长代码库的理解能力明显强于同尺寸模型。

有个实用细节:它支持2,048 tokens的完整文件生成,不是那种只能写函数的玩具。如果你做微服务开发,拿它生成一个完整的RESTful API控制器,包括异常处理和日志埋点,基本不用改。建议感兴趣的可以在自己的代码库上跑个few-shot测试,对比一下它和CodeLlama的差异,尤其在跨文件引用和类型推断的准确率上提升很明显。
回复

使用道具 举报

精彩评论1

noavatar
juson 显示全部楼层 发表于 昨天 21:02
90.2%的HumanEval确实亮眼,但MoE在长上下文任务中效果如何?之前用STARCODER总觉得代码逻辑一长就迷路,这货能撑住吗?🤔
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表