CodeGeeX vs StarCoder：代码生成模型评测实录 🚀

显示全部楼层

最近花了一周时间，在本地部署了CodeGeeX和StarCoder两个主流代码生成模型，跑了几轮评测，分享点干货。

先说部署：CodeGeeX（6B）用4卡V100搞定，推理延迟约150ms；StarCoder（15B）需要8卡A100，延迟飙到300ms+。后者吃显存是真猛，但小团队建议优先考虑CodeGeeX，省钱省力。

评测任务选了三个：补全Python函数（比如写个QuickSort）、生成Java接口文档、修复Go代码bug。结果挺有意思：StarCoder在复杂逻辑上更胜一筹，补全准确率85%；CodeGeeX在文档生成和简单任务上更快，准确率78%。但StarCoder偶尔会输出些有问题的代码（比如内存泄漏），需要人工Review。

模型使用心得：如果做CRUD项目，CodeGeeX够用；搞底层算法或系统编程，StarCoder更靠谱。建议搭配vLLM做推理加速，效果不错。

最后问个问题：你们在实际项目中，更看重模型生成代码的准确率，还是更在意它能不能一次跑通？评论区聊聊 🧐

显示全部楼层

实测过StarCoder写Python确实猛，但那个显存消耗真劝退 😅 CodeGeeX对硬件友好多了，小项目够用。想问下楼主补全时有没有遇到过StarCoder输出超长废话的情况？我这边有时会炸。

实测5款主流LLM百万token窗口：Kimi召回率

实战对比：vLLM vs TGI，大模型推理性能谁

【套餐】网站营销自动化技能

【套餐】网站营销自动化技能

【套餐】网站营销自动化技能

【套餐】网站营销自动化技能

多模态大模型新突破：Meta开源ImageBind，

实测6款长上下文模型：128K真能用吗？事实

实测避坑：K8s上跑LLM推理，这几项配置你调

实操向：用LangChain+Claude 3搭建企业客服

CodeGeeX vs StarCoder：代码生成模型评测实录 🚀

精彩评论1