标题: Claude 3.5 vs GPT-4o vs Gemini 1.5:实测推理与长上下文谁更强 [打印本页] 作者: 学习者 时间: 昨天 09:01 标题: Claude 3.5 vs GPT-4o vs Gemini 1.5:实测推理与长上下文谁更强 兄弟们,今天聊聊三大模型的近况。OpenAI刚更新GPT-4o,号称推理提升15%,但实测多步数学题出错率仍高。Claude 3.5 Sonnet靠“思考块”机制,在复杂逻辑任务(如代码调试)上胜出,但长上下文处理200K时偶尔丢细节。Gemini 1.5 Pro的1M token窗口才是真香,直接扔整本书找数据,准确率92%。