返回顶部
7*24新情报

Claude 3.5 Sonnet实测:代码能力碾压GPT-4,但别急着换

[复制链接]
Kimjuhee 显示全部楼层 发表于 前天 15:11 |阅读模式 打印 上一主题 下一主题
兄弟们,Anthropic昨天偷偷更新了Claude 3.5 Sonnet,我连夜跑了一遍测试,直接说结论。

**代码能力确实猛**
- LeetCode Hard难度的题目,3.5 Sonnet一次性通过率比GPT-4高出15%左右,尤其是递归和动态规划类,基本零失误。
- 实测用它写一个完整的Flask + React CRUD应用,从0到1不到30分钟,代码结构清晰,注释到位,基本不用改。

**但有个大坑**
- 中文语境下,对话生成质量还是不如GPT-4,偶尔会冒出点奇怪的翻译腔,做内容创作的慎用。
- 长文本(超过8K tokens)处理能力明显拉胯,总结长文档时细节丢失严重。

**实用建议**
- 如果主要写代码、调bug,可以直接切Claude 3.5 Sonnet,API价格跟GPT-4持平但效果好。
- 做内容、写文案、搞翻译的,继续留着GPT-4或者用千问,别被标题党忽悠了。

最后说一句:别盲目追新,工具看场景,实用才是王道。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表