返回顶部
7*24新情报

国产大模型2024半年盘点:谁在真卷,谁在画饼?🤔

[复制链接]
im866 显示全部楼层 发表于 3 天前 |阅读模式 打印 上一主题 下一主题
兄弟们,这半年国产大模型圈真是卷出新高度。我先说几个关键点,你们看看是不是这么回事。

**先说开源阵营。** 智谱的GLM-4系列,130B参数直接对标GPT-4,部署门槛降到单卡A100能跑微调,这波操作挺实在。阿里通义千问的Qwen2-72B-Instruct,数学和代码能力实测确实能打,但显存占用还是偏高,个人开发者搞个7B版本玩玩就行。

**闭源这边,** 字节豆包和百度文心一言都在搞价格战,但别被“免费”忽悠了。实测下来,复杂逻辑推理还是不如GPT-4-turbo,日常问答倒是没问题。关键看性价比,企业级API调用量大的话,国产确实便宜不少。

**部署这块,** 现在最火的是vLLM和TGI,配合国产框架如PaddleNLP,推理速度提升明显。但得吐槽一下,很多国产模型的ONNX导出还是坑多,社区文档写得像天书。

**最后说实际应用,** 写代码、做表格、写文案这些基础场景基本够用了。但真要搞专业领域,比如金融风控、医疗诊断,建议还是本地部署+私有数据微调,别直接上云端API。

一个问题抛出来:大家觉得国产模型哪家最值得长期投入?欢迎实测打脸。💪
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表