兄弟们,最近RAG领域又一个硬核项目出炉了——LongRewriter,来自中科大和腾讯的联合研究。不是什么花哨概念,就是实实在在地优化了检索到生成之间的“翻译”环节。
目前大多数RAG系统在检索阶段用的是原始查询,但用户意图往往模糊、短小,导致检索命中率拉胯。LongRewriter的思路很简单:把用户query转译成更利于检索的长文本形式,而不是传统query重写那套短query扩展。
实测数据:在MultiHopQA和HotpotQA这类多跳推理数据集上,Top-5检索命中率提升了25%+,生成准确率提升约18%。核心原理是利用LLM建模“理想检索文档”的分布,训练了一个轻量的长文本改写模型,参数量仅7B,单次推理延迟低于100ms。
重点来了:代码和模型权重都在GitHub上开源了(搜索LongRewriter),基于Llama-3.1-8B微调,部署门槛中等,单卡A100可跑。建议正在做企业级RAG的兄弟重点关注,尤其涉及复杂业务逻辑的场景,这个改写层能大幅提升召回质量。
说句实在的,RAG现在最大的瓶颈不在生成,就在检索这一下。LongRewriter的处理方式,比单纯加reranker成本低、可解释性强。有兴趣的可以跑个线下测试,对比传统Hybrid Search效果,差距肉眼可见。 |