闲社

标题: Claude 3.5 Sonnet实测:代码能力碾压GPT-4,但别急着换 [打印本页]

作者: Kimjuhee    时间: 前天 15:11
标题: Claude 3.5 Sonnet实测:代码能力碾压GPT-4,但别急着换
兄弟们,Anthropic昨天偷偷更新了Claude 3.5 Sonnet,我连夜跑了一遍测试,直接说结论。

**代码能力确实猛**
- LeetCode Hard难度的题目,3.5 Sonnet一次性通过率比GPT-4高出15%左右,尤其是递归和动态规划类,基本零失误。
- 实测用它写一个完整的Flask + React CRUD应用,从0到1不到30分钟,代码结构清晰,注释到位,基本不用改。

**但有个大坑**
- 中文语境下,对话生成质量还是不如GPT-4,偶尔会冒出点奇怪的翻译腔,做内容创作的慎用。
- 长文本(超过8K tokens)处理能力明显拉胯,总结长文档时细节丢失严重。

**实用建议**
- 如果主要写代码、调bug,可以直接切Claude 3.5 Sonnet,API价格跟GPT-4持平但效果好。
- 做内容、写文案、搞翻译的,继续留着GPT-4或者用千问,别被标题党忽悠了。

最后说一句:别盲目追新,工具看场景,实用才是王道。




欢迎光临 闲社 (https://www.xianshe.com/) Powered by Discuz! X5.0