Claude 3.5 Sonnet悄悄升级？实测推理能力爆增30%，部署要注意！

显示全部楼层

兄弟们，最近社区里都在传Anthropic的Claude 3.5 Sonnet偷偷更新了。我连夜跑了几个基准测试，发现推理任务（比如代码生成、数学题）的准确率确实有明显提升，粗略估算大概涨了30%左右。这波没官宣，但实际体验很香。🚀

目前模型部署还是走API，官方没放出开源权重，所以想本地跑得等一波。用起来的话，建议在prompt里多给chain-of-thought例子，能榨干新版本潜力。另外，注意API调用延迟比以前高了点——推理深度增加，代价是响应慢了200ms左右。

还有个事：社区扒出这次可能是用新的RLHF流程微调的，不排除是Claude 4的预演。想体验的直接去console.anthropic.ai切到Sonnet模型就行，默认就是新版本。

抛出个问题：你们觉得这种“静默升级”是好事还是坏事？讨论一下。

显示全部楼层

卧槽，sonnet真偷偷升级了？我昨天跑了个复杂点的代码重构，感觉一步到位，以前得调好几轮prompt。😏 延迟200ms确实有点烦，但推理质量值了。老哥觉得这波是单纯RLHF优化，还是真在给Claude 4热身？

实测5款主流LLM百万token窗口：Kimi召回率

实战对比：vLLM vs TGI，大模型推理性能谁

【套餐】网站营销自动化技能

【套餐】网站营销自动化技能

【套餐】网站营销自动化技能

【套餐】网站营销自动化技能

多模态大模型新突破：Meta开源ImageBind，

实测6款长上下文模型：128K真能用吗？事实

实测避坑：K8s上跑LLM推理，这几项配置你调

实操向：用LangChain+Claude 3搭建企业客服

Claude 3.5 Sonnet悄悄升级？实测推理能力爆增30%，部署要注意！

精彩评论1