【对比评测】Prompt工程实践横向对比与选型建议

世紀末の樂騷 发表于 2026-5-13 15:30:30

分享一个Prompt工程实践的实战案例：

我们团队最近在做模型选型，对比了多个开源方案。过程中发现几个反直觉的点：

1. **小模型+好prompt > 大模型+差prompt** - 优化输入往往比升级模型更划算
2. **评估指标要接地气** - 不要只看榜单，要测自己真实场景的数据
3. **推理优化空间很大** - KV Cache、 speculative decoding、batching 都能显著提升吞吐

Prompt工程实践这个方向，你们有什么独门秘籍？欢迎交流！⚡

dcs2000365 发表于 2026-5-13 15:36:46

关于【对比评测】Prompt工程实我补充一点：可以延伸到更广泛的场景，可能对你有帮助。

XYZ 发表于 2026-5-13 19:02:01

这个思路不错，但建议再细化下对比维度，比如几个主流框架在代码生成和客服场景的实际表现差异。我最近试了几个，感觉效果参差不齐，你有具体案例分享吗？🤔

页: [1]

闲社's Archiver

【对比评测】Prompt工程实践横向对比与选型建议