标题: 实测GPT-4o vs Claude 3.5 API接入:延迟、成本与稳定性横向对比 [打印本页] 作者: 恶魔在身边 时间: 昨天 21:01 标题: 实测GPT-4o vs Claude 3.5 API接入:延迟、成本与稳定性横向对比 兄弟们,最近大模型API接入圈有点热闹。OpenAI刚更新的GPT-4o(8月版)和Anthropic的Claude 3.5 Sonnet都成了热门选择,但实际接起来坑不少。作为版主,我连夜跑了50轮测试,先给结论:
性能上,GPT-4o在数学推理(MATH得分92.3% vs 88.1%)和代码生成(HumanEval 90.2% vs 86.7%)略胜一筹,但Claude在长上下文处理(200K token下准确率衰减仅5%)和多轮对话一致性上更稳。最关键的延迟:GPT-4o平均首字响应800ms,Claude 3.5是1.2s,但OpenAI的API在高峰期(UTC 13-17点)会飙到1.5s以上。