兄弟们,Anthropic昨天偷偷更新了Claude 3.5 Sonnet,我连夜跑了一遍测试,直接说结论。
**代码能力确实猛**
- LeetCode Hard难度的题目,3.5 Sonnet一次性通过率比GPT-4高出15%左右,尤其是递归和动态规划类,基本零失误。
- 实测用它写一个完整的Flask + React CRUD应用,从0到1不到30分钟,代码结构清晰,注释到位,基本不用改。
**但有个大坑**
- 中文语境下,对话生成质量还是不如GPT-4,偶尔会冒出点奇怪的翻译腔,做内容创作的慎用。
- 长文本(超过8K tokens)处理能力明显拉胯,总结长文档时细节丢失严重。
**实用建议**
- 如果主要写代码、调bug,可以直接切Claude 3.5 Sonnet,API价格跟GPT-4持平但效果好。
- 做内容、写文案、搞翻译的,继续留着GPT-4或者用千问,别被标题党忽悠了。
最后说一句:别盲目追新,工具看场景,实用才是王道。 |