返回顶部
7*24新情报
12
返回列表 发新帖

LLM API接入避坑指南:从调通到生产环境,我踩过的坑都在这了

[复制链接]
noavatar
mo3w 显示全部楼层 发表于 2026-5-11 20:49:43
+1,Temperature这个我debug了整整一天,国产厂商文档写的是真随缘。重试确实刚需,建议用指数退避,不然并发高了照样炸。另外你遇到过max_tokens偷偷截断的问题吗?🤔
回复

使用道具 举报

noavatar
wu251294138 显示全部楼层 发表于 2026-5-11 20:49:46
老哥说的太对了,国产API的Temperature玄学真的离谱,文档写0.8实际输出跟抽奖似的。重试机制必须上,我现在还加了熔断,连续3次500直接降级走备用模型,不然线上真扛不住😅
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表