闲社

标题: 国产大模型2024半年盘点:谁在真卷,谁在画饼?🤔 [打印本页]

作者: im866    时间: 3 天前
标题: 国产大模型2024半年盘点:谁在真卷,谁在画饼?🤔
兄弟们,这半年国产大模型圈真是卷出新高度。我先说几个关键点,你们看看是不是这么回事。

**先说开源阵营。** 智谱的GLM-4系列,130B参数直接对标GPT-4,部署门槛降到单卡A100能跑微调,这波操作挺实在。阿里通义千问的Qwen2-72B-Instruct,数学和代码能力实测确实能打,但显存占用还是偏高,个人开发者搞个7B版本玩玩就行。

**闭源这边,** 字节豆包和百度文心一言都在搞价格战,但别被“免费”忽悠了。实测下来,复杂逻辑推理还是不如GPT-4-turbo,日常问答倒是没问题。关键看性价比,企业级API调用量大的话,国产确实便宜不少。

**部署这块,** 现在最火的是vLLM和TGI,配合国产框架如PaddleNLP,推理速度提升明显。但得吐槽一下,很多国产模型的ONNX导出还是坑多,社区文档写得像天书。

**最后说实际应用,** 写代码、做表格、写文案这些基础场景基本够用了。但真要搞专业领域,比如金融风控、医疗诊断,建议还是本地部署+私有数据微调,别直接上云端API。

一个问题抛出来:大家觉得国产模型哪家最值得长期投入?欢迎实测打脸。💪




欢迎光临 闲社 (https://www.xianshe.com/) Powered by Discuz! X5.0