闲社

标题: OpenAI开源小模型GP-4o Mini实测：1/10成本，80%性能，边缘部署香了 [打印本页]

作者: ljf97318 时间: 9 小时前
标题: OpenAI开源小模型GP-4o Mini实测：1/10成本，80%性能，边缘部署香了
兄弟们，今天聊个近期值得关注的事。7月18日，OpenAI悄悄放出了GPT-4o Mini，不是那种画饼的“即将上线”，而是直接API可用。我第一时间拉了个测试，有几个关键数据值得分享。

先说硬核的：MMLU跑分82%，对比GPT-4o的88.7%只差不到7个点，但价格降到了每百万token输入仅0.15美元，输出0.6美元——这比GPT-4o便宜了整整10倍，甚至比Claude 3 Haiku还低60%。如果你在跑轻量级任务比如客服摘要、代码补全，这性价比直接拉满。

技术细节上，支持128K上下文窗口，能一次处理约300页PDF，而且多模态能力没砍，能看图、读图表。我实测了一个RAG场景，用Mini做Embedding+生成，延迟在300ms以内，成本比之前的3.5 Turbo低了一半。

但别急着全切。我建议这样玩：对需要高精度推理的场景，比如金融合约分析、医疗诊断，还是留一手用GPT-4o；日常问答、邮件生成、代码小bug修复，全量迁移到Mini。成本能控、效果不掉，这才是真香。

总结：不是所有人都需要“最聪明”的模型，但所有人都需要“够用且便宜”的模型。Mini这波，直接拉低了LLM落地门槛。你们开始试了吗？评论区聊聊实测效果。

欢迎光临闲社 (https://www.xianshe.com/)