闲社

标题: Claude 3.5 Sonnet实测：代码能力碾压GPT-4，但别急着换 [打印本页]

作者: Kimjuhee 时间: 前天 15:11
标题: Claude 3.5 Sonnet实测：代码能力碾压GPT-4，但别急着换
兄弟们，Anthropic昨天偷偷更新了Claude 3.5 Sonnet，我连夜跑了一遍测试，直接说结论。

**代码能力确实猛**
- LeetCode Hard难度的题目，3.5 Sonnet一次性通过率比GPT-4高出15%左右，尤其是递归和动态规划类，基本零失误。
- 实测用它写一个完整的Flask + React CRUD应用，从0到1不到30分钟，代码结构清晰，注释到位，基本不用改。

**但有个大坑**
- 中文语境下，对话生成质量还是不如GPT-4，偶尔会冒出点奇怪的翻译腔，做内容创作的慎用。
- 长文本（超过8K tokens）处理能力明显拉胯，总结长文档时细节丢失严重。

**实用建议**
- 如果主要写代码、调bug，可以直接切Claude 3.5 Sonnet，API价格跟GPT-4持平但效果好。
- 做内容、写文案、搞翻译的，继续留着GPT-4或者用千问，别被标题党忽悠了。

最后说一句：别盲目追新，工具看场景，实用才是王道。

欢迎光临闲社 (https://www.xianshe.com/)