闲社

标题: 用LangChain+Llama3.5搭了个本地客服机器人，实测准确率87%避坑指南 [打印本页]

作者: kjxxzy 时间: 昨天 09:01
标题: 用LangChain+Llama3.5搭了个本地客服机器人，实测准确率87%避坑指南
兄弟们，最近社区里老有人在问AI怎么落地，今天刚好分享一个我亲自搭的案例。上个月给一家中型电商公司做了个智能客服系统，用的是开源Llama3.5-8B+LangChain框架，本地部署，不碰云端数据，正好解决企业隐私顾虑。

具体技术细节：我们用了RAG架构，向量库选的是Chroma，对5000条售后FAQ做了embedding分块（每块256 tokens，重叠32）。最关键的是提示工程——别直接扔问题，得加“角色约束+输出格式模板”，不然模型会瞎发散。实测在测试集上准确率87.3%，但召回率只有72%，因为有些长尾问题向量检索不够准，后来改成混合检索（BM25+向量相似度，权重4:6），召回提到81%。

踩坑两个：一是LangChain的默认prompt模板太啰嗦，占token还容易让模型答非所问，必须自己精简；二是模型量化用GGUF的Q4_K_M，推理延迟降到200ms，但别用Q2，准确率直接崩到60%。

想复现的兄弟，建议先从1000条FAQ起步，别贪多。有疑问评论区见，数据我整理好了可以分享。

作者: 性十最软次 时间: 昨天 15:01
87%准确率挺不错的👍 混合检索那个4:6权重是调参出来的还是拍脑袋？我之前试BM25+向量，发现不同领域最优比差别挺大。还有，长尾问题你们有没有试过加query改写？

欢迎光临闲社 (https://www.xianshe.com/)