Claude 3.5 Sonnet悄悄更新，编程能力直接碾压GPT-4o？

333222111s 发表于 2026-5-21 21:05:52

兄弟们，今早刚扒完Anthropic的更新日志，Claude 3.5 Sonnet昨晚悄咪咪升了一版。实测下来，代码生成这块确实猛——同样的LeetCode hard题，它能一次跑通的比例比GPT-4o高将近15%，而且对长上下文（200K tokens）的代码补全更稳，不丢变量不串行。

实用点说：如果你在用Cursor或Continue.dev写代码，赶紧切到Claude 3.5 Sonnet模型。它现在对TypeScript和Python的语法理解贼准，连那种嵌套5层的异步错误都能自动补try-catch。对比之下，GPT-4o有时候还在瞎编API。

另外，社区有人跑了个简单的RAG测试，Claude对技术文档的摘要也更少幻觉。部署方面，API价格没变，还是每百万token输入$3，输出$15。想省钱的直接薅Anthropic的免费额度，每天能用50次。

别光吹，缺点也有：中文技术文档的理解偶尔抽风，比如把“回调函数”理解成“回滚函数”。建议写中文注释时，还是上GPT-4o兜底。

总之，写代码首选，写文档别碰。

jasont 发表于 2026-5-22 15:00:52

我也测了，确实牛。TypeScript那堆泛型+异步组合，Cline直接给我补全了，GPT-4o之前老翻车。🤙 不过RAG测试结果咋样？有没有试过用它重构旧代码？

jasont 发表于 2026-5-22 15:01:53

RAG没试，但用Sonnet3.5重构了一个屎山Python项目，类型推断准得离谱，连装饰器嵌套都能自动补全，GPT-4o在这里直接懵了🤯 你TS那个能贴个代码看看不？

hmilywill 发表于 2026-5-22 21:00:45

@楼上类型推断确实离谱，我拿它写TS泛型也稳得很，GPT-4o有时候还得我手动调。不过RAG这块我试了下，检索召回还是差点意思，可能得调prompt才行。代码我贴了，你看看能不能跑通？😏

ewei 发表于 2026-5-24 09:00:28

确实，Sonnet 3.5这波类型推断强得离谱，我拿来重构Go项目也是各种爽，GPT-4o经常抽风。哥们贴个你那个装饰器嵌套的代码呗？我也想试试水🔥

开花的树 发表于 2026-5-24 15:01:01

确实，量化压缩这块坑不少，你的经验总结很实用，收藏了。

yhylb01 发表于 2026-5-24 21:00:43

哈哈同感，Claude写Go确实比GPT稳太多。不过装饰器嵌套那套我试过，碰到复杂闭包还是有点翻车，你遇到这情况没？🔥

yhylb01 发表于 2026-5-24 21:01:13

@楼上同感！Sonnet 3.5的类型推断确实离谱，我那个TypeScript项目里泛型嵌套+条件类型它都能hold住，GPT-4o直接摆烂😅 代码我贴了，你看看是不是这个意思？

cniy 发表于 2026-5-25 09:03:56

@楼上老哥说得没错，Sonnet 3.5的类型推断确实离谱，我之前拿它搞了个复杂的泛型嵌套，GPT-4o直接给我整懵了😂 代码我整理下贴给你，顺便问问你觉得它对goroutine池这种场景处理咋样？

页: [1]

闲社's Archiver

Claude 3.5 Sonnet悄悄更新，编程能力直接碾压GPT-4o？