闲社 › 开发社区 › 模型社区 › OpenAI开源小模型GP-4o Mini实测：1/10成本，80%性能， ...

ljf97318

发帖数42
粉丝0

此人很懒，什么也没有留下

阅读Ta更多精彩帖

7*24新情报

2026-07-02 [模型社区]

RAG系统性能瓶颈：向量检索Top-K召回率如何

兄弟们，最近社区里RAG（检索增强生成）的热度不减，但不少朋友反馈：检索阶段Top-K召

2026-07-02 [模型社区]

ChatTTS新增情感调节参数，语音合成可控性

今天聊个具体的——ChatTTS刚更新了情感控制接口，实测下来挺惊喜。简单说，现在可以

2026-07-02 [模型社区]

OpenAI开源小模型GP-4o Mini实测：1/10成本

兄弟们，今天聊个近期值得关注的事。7月18日，OpenAI悄悄放出了GPT-4o Mini，不是那种

2026-07-02 [模型社区]

模型蒸馏新突破：小模型精度逼近大模型，效

最近，Meta开源了一篇关于模型蒸馏的重量级论文，直接引爆了技术圈。他们通过改进的“

2026-07-02 [新手指南]

【使用指南】NanoClaw：极简安全版，约4000

最近在用 NanoClaw，分享一下使用心得。 **核心功能：** 极简安全版，约4000行代码

2026-07-01 [模型社区]

LangGraph实战：用0代码搭建Agent状态机，

兄弟们，今天聊个硬核的。LangChain刚更新了LangGraph v0.3，支持用YAML配置文件定义A

2026-07-01 [模型社区]

Stable Diffusion 3.5开源实测：10秒出图，

兄弟们，今天聊聊Stable Diffusion 3.5（SD3.5）的最新进展。上周Stability AI放出了S

2026-07-01 [模型社区]

干货｜AutoGen 0.4发布？聊聊多Agent协作的

兄弟们，微软昨晚悄咪咪更新了AutoGen 0.4，虽然还是预览版，但有几个改动值得关注。

2026-07-01 [模型社区]

ChatTTS开源后炸场，语音合成大模型终于能

兄弟们，今天必须聊聊刚开源不久的ChatTTS。这玩意儿不是传统TTS那种“机械朗读”，而

2026-07-01 [模型社区]

实测DeepSeek-R1、Qwen3、GLM-5三款国产大

各位老铁，最近国产大模型卷出新高度，我拿三款最新开源模型搞了一波实测：DeepSeek-R

阅读排行

1 【版规】开发社区 - 版块介绍

2 AI赛道新浪潮：3D重建与大模型的融合时代

3 AI技术新风向：3D重建、模型革新与智能硬件的融合

4 深入浅出：架构设计的艺术与挑战🤓

5 AI赛道新风向：3D重建与模型革新引领未来🚀

6 分享一些实用的开发工具

7 整理了一些学习资料

8 整理了一些学习资料

9 分享一些实用的脚本工具

10 推荐几个好用的软件资源

OpenAI开源小模型GP-4o Mini实测：1/10成本，80%性能，边缘部署香了

[复制链接]

ljf97318 显示全部楼层 发表于 8 小时前 |阅读模式

兄弟们，今天聊个近期值得关注的事。7月18日，OpenAI悄悄放出了GPT-4o Mini，不是那种画饼的“即将上线”，而是直接API可用。我第一时间拉了个测试，有几个关键数据值得分享。

先说硬核的：MMLU跑分82%，对比GPT-4o的88.7%只差不到7个点，但价格降到了每百万token输入仅0.15美元，输出0.6美元——这比GPT-4o便宜了整整10倍，甚至比Claude 3 Haiku还低60%。如果你在跑轻量级任务比如客服摘要、代码补全，这性价比直接拉满。

技术细节上，支持128K上下文窗口，能一次处理约300页PDF，而且多模态能力没砍，能看图、读图表。我实测了一个RAG场景，用Mini做Embedding+生成，延迟在300ms以内，成本比之前的3.5 Turbo低了一半。

但别急着全切。我建议这样玩：对需要高精度推理的场景，比如金融合约分析、医疗诊断，还是留一手用GPT-4o；日常问答、邮件生成、代码小bug修复，全量迁移到Mini。成本能控、效果不掉，这才是真香。

总结：不是所有人都需要“最聪明”的模型，但所有人都需要“够用且便宜”的模型。Mini这波，直接拉低了LLM落地门槛。你们开始试了吗？评论区聊聊实测效果。