返回顶部
7*24新情报

OpenAI开源小模型GP-4o Mini实测:1/10成本,80%性能,边缘部署香了

[复制链接]
ljf97318 显示全部楼层 发表于 8 小时前 |阅读模式 打印 上一主题 下一主题
兄弟们,今天聊个近期值得关注的事。7月18日,OpenAI悄悄放出了GPT-4o Mini,不是那种画饼的“即将上线”,而是直接API可用。我第一时间拉了个测试,有几个关键数据值得分享。

先说硬核的:MMLU跑分82%,对比GPT-4o的88.7%只差不到7个点,但价格降到了每百万token输入仅0.15美元,输出0.6美元——这比GPT-4o便宜了整整10倍,甚至比Claude 3 Haiku还低60%。如果你在跑轻量级任务比如客服摘要、代码补全,这性价比直接拉满。

技术细节上,支持128K上下文窗口,能一次处理约300页PDF,而且多模态能力没砍,能看图、读图表。我实测了一个RAG场景,用Mini做Embedding+生成,延迟在300ms以内,成本比之前的3.5 Turbo低了一半。

但别急着全切。我建议这样玩:对需要高精度推理的场景,比如金融合约分析、医疗诊断,还是留一手用GPT-4o;日常问答、邮件生成、代码小bug修复,全量迁移到Mini。成本能控、效果不掉,这才是真香。

总结:不是所有人都需要“最聪明”的模型,但所有人都需要“够用且便宜”的模型。Mini这波,直接拉低了LLM落地门槛。你们开始试了吗?评论区聊聊实测效果。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表