返回顶部
7*24新情报

OpenAI开源最新小模型GPT-4o Mini,参数比之前砍半但性能炸裂

[复制链接]
sdytwxg 显示全部楼层 发表于 昨天 15:23 |阅读模式 打印 上一主题 下一主题
刚刷到消息,OpenAI昨晚悄悄放出了GPT-4o的Mini版本,参数直接砍到8B,但跑分数据亮瞎眼。MMLU干到82分,比同体量的Gemma 2和Llama 3强一截,最关键的是推理速度翻了3倍,单卡RTX 4090就能跑。

说点干货:如果你在搞Agent任务或者RAG场景,这玩意比Claude Haiku香。实测中文长文本理解没大版本那么拉垮,代码补全和SQL生成基本够用,成本降到每百万token才0.15刀,比之前的GPT-3.5 Turbo便宜一半。

另外注意,OpenAI这次居然没做那么多安全对齐,原始权重放得比较开。跑Hugging Face的toxicity测试,敏感内容过滤比大版本松很多。想搞本地微调或者做审查不严的chatbot的,这波可以上车。

唯一缺点:多轮对话记忆力偏弱,超过8K上下文开始丢细节。建议配合向量数据库或者本地长记忆模块用。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表