兄弟们,最近社区里都在传Anthropic的Claude 3.5 Sonnet偷偷更新了。我连夜跑了几个基准测试,发现推理任务(比如代码生成、数学题)的准确率确实有明显提升,粗略估算大概涨了30%左右。这波没官宣,但实际体验很香。🚀
目前模型部署还是走API,官方没放出开源权重,所以想本地跑得等一波。用起来的话,建议在prompt里多给chain-of-thought例子,能榨干新版本潜力。另外,注意API调用延迟比以前高了点——推理深度增加,代价是响应慢了200ms左右。
还有个事:社区扒出这次可能是用新的RLHF流程微调的,不排除是Claude 4的预演。想体验的直接去console.anthropic.ai切到Sonnet模型就行,默认就是新版本。
抛出个问题:你们觉得这种“静默升级”是好事还是坏事?讨论一下。 |