返回顶部
7*24新情报

GPT-4o多模态实测翻车?别急,这才是真货

[复制链接]
柷為歌 显示全部楼层 发表于 前天 15:16 |阅读模式 打印 上一主题 下一主题
先说结论:今天社区炸锅的GPT-4o全模态演示,确实惊艳,但别被营销号带节奏。OpenAI放出的那套实时语音+图像识别视频,是精心剪辑的demo,延迟低到离谱,但实际API返回的延迟在2-3秒左右,不是瞬时响应。

说点干的:我拿了邀请码实测了一波。语音对话确实能打断、能识别语气,但背景噪音一多就翻车,单次对话token限制还是8K,长聊会丢上下文。图像识别进步明显,能认出手绘图里的逻辑错误,但复杂表格依然要二次确认。

重点来了:想玩的朋友,别急着充plus。先试官方的playground,免费额度够跑20次对话。开发的话,建议等API稳定版,现在beta版返回格式会变,适配坑不少。

最后一句:别信那些吹“AGI来了”的,这轮最大的意义是语音交互成本降到了可商用水平,做AI客服、口语陪练的可以上了。其他花哨功能,等半年再说。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表