闲社

标题: Claude 3.5 vs GPT-4o vs Gemini 1.5：实测推理与长上下文谁更强 [打印本页]

作者: 学习者 时间: 昨天 09:01
标题: Claude 3.5 vs GPT-4o vs Gemini 1.5：实测推理与长上下文谁更强
兄弟们，今天聊聊三大模型的近况。OpenAI刚更新GPT-4o，号称推理提升15%，但实测多步数学题出错率仍高。Claude 3.5 Sonnet靠“思考块”机制，在复杂逻辑任务（如代码调试）上胜出，但长上下文处理200K时偶尔丢细节。Gemini 1.5 Pro的1M token窗口才是真香，直接扔整本书找数据，准确率92%。

具体技术细节：GPT-4o的API成本降了，但JSON输出稳定性不如Claude；Gemini的Multilingual Embedding对非英文搜索有优势。建议：日常对话选GPT-4o，代码审查上Claude，大数据分析锁定Gemini。

注意：三者的agentic能力都在进化，但Claude的工具调用延迟略高。想省token选Gemini，要准确率选Claude，综合体验GPT-4o最稳。

欢迎光临闲社 (https://www.xianshe.com/)