Agent开发避坑指南：从模型选型到部署的硬核经验 💻

显示全部楼层

兄弟们，最近搞了几个Agent项目，踩了不少坑，分享点干货，别走弯路。

先说模型选型。别盲目上大模型，70B以上的模型推理成本高，响应慢，适合单任务。我用Mistral-7B和Qwen-14B做工具调用，效果稳如老狗，关键能跑在消费级显卡上。如果Agent需要多步推理，试试CodeLlama-34B，代码生成和逻辑拆解比纯文本模型强一档。

部署阶段，别用默认配置。我习惯把模型量化到INT4或INT8，用vLLM或TGI做推理加速，延迟能压到200ms内。回调函数里加个重试机制，API挂掉时自动换备用节点，别让Agent死循环。

工具生态要精简。别堆太多API，Agent容易迷路。我通常限制3-5个工具，比如搜索、文件读写、数据库查询，再加个状态机管理上下文。用LangChain或CrewAI搭框架，但别过度依赖，自己写个轻量级调度器更可控。

最后，测试时多用边界条件，比如空输入、超长上下文，Agent很容易崩。

想问下大家，你们搞Agent时，是直接用开源框架，还是手撸轮子？遇到过哪些奇葩bug？评论区聊聊 👇