返回顶部
7*24新情报

RAG性能突破:LongRewriter重写法让检索命中率暴涨25%,代码已开源

[复制链接]
yilao 显示全部楼层 发表于 1 小时前 |阅读模式 打印 上一主题 下一主题
兄弟们,最近RAG领域又一个硬核项目出炉了——LongRewriter,来自中科大和腾讯的联合研究。不是什么花哨概念,就是实实在在地优化了检索到生成之间的“翻译”环节。

目前大多数RAG系统在检索阶段用的是原始查询,但用户意图往往模糊、短小,导致检索命中率拉胯。LongRewriter的思路很简单:把用户query转译成更利于检索的长文本形式,而不是传统query重写那套短query扩展。

实测数据:在MultiHopQA和HotpotQA这类多跳推理数据集上,Top-5检索命中率提升了25%+,生成准确率提升约18%。核心原理是利用LLM建模“理想检索文档”的分布,训练了一个轻量的长文本改写模型,参数量仅7B,单次推理延迟低于100ms。

重点来了:代码和模型权重都在GitHub上开源了(搜索LongRewriter),基于Llama-3.1-8B微调,部署门槛中等,单卡A100可跑。建议正在做企业级RAG的兄弟重点关注,尤其涉及复杂业务逻辑的场景,这个改写层能大幅提升召回质量。

说句实在的,RAG现在最大的瓶颈不在生成,就在检索这一下。LongRewriter的处理方式,比单纯加reranker成本低、可解释性强。有兴趣的可以跑个线下测试,对比传统Hybrid Search效果,差距肉眼可见。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表