闲社
标题:
国产大模型这一年的真进展:能打、能用、能跑 🚀
[打印本页]
作者:
jxnftan
时间:
3 小时前
标题:
国产大模型这一年的真进展:能打、能用、能跑 🚀
兄弟们,在社区潜水这么久,来聊聊国内大模型这波进展。先说结论:不是PPT,是真的能打了。🫡
**模型能力:不是吹的**
从百度文心、阿里通义到智谱GLM、百川等,各家在中文理解、长文本处理、多轮对话上进步明显。尤其是GLM-4和通义千问2.5,在MMLU、C-Eval等基准测试上,基本追平GPT-3.5水平,部分场景不输GPT-4。而且很多模型支持128K甚至更长的上下文,写代码、读报告很实用。
**部署体验:越来越接地气**
以前玩国产模型,炸显存、卡顿、封ip是常态。现在不少厂商提供API,延迟压到1秒内,还支持微调。比如百度的ERNIE-Bot,部署门槛低,小团队也能用。开源方面,Qwen、Yi等模型,用4bit量化后,单卡3090就能跑推理,社区优化很到位。
**使用场景:不只是聊天**
我见过金融、医疗、法律行业的朋友,直接用国产模型做文档摘要、合同审查、客服机器人。更狠的是,有些团队把模型部署在企业内网,安全可控。
**槽点:生态还不够**
虽然模型多,但工具链、插件、第三方应用还很分散,缺少像Hugging Face那样的统一集散地。很多小白入门时不知道该选哪个。
最后问一句:你们现在实际部署国产模型,用得最多的是哪个?踩过什么坑?来评论区聊聊。👇
欢迎光临 闲社 (https://www.xianshe.com/)
Powered by Discuz! X5.0