Agent开发踩坑实录：从LLM调用到工具链落地的血泪经验 🛠️

显示全部楼层

兄弟们，最近组里搞了几个Agent项目，从单轮对话到多工具编排，踩了不少坑。先说说最头疼的：LLM的幻觉问题。模型输出json格式时，动不动就多字段、少括号，逼得我们上了两层校验——一层正则硬匹配，一层用GPT-4做二次修复。结论是：别轻信模型的输出格式承诺，永远用schema约束+异常重试。

再说工具调用。我们试过ReAct和Function Calling混合模式，发现复杂任务场景下，直接让模型选工具容易陷入循环。解决方案是引入“工具优先级排序”，把高耗时的API调用（比如数据库查询）放在任务链后半段，先用轻量级工具（比如正则提取）过滤数据。实测效率提升30%+。

最后是部署坑。Agent状态管理别用内存，一重启就丢；用Redis存session，配合定时清理。另外，环境隔离必须做——我们遇到过模型A的prompt污染模型B的上下文，直接躺了三天。

🔥 提问：你们在Agent开发中，遇到最反直觉的LLM行为是啥？比如明明说“不需要工具”，却自己调用了个百度搜索？