RAG性能突破：LongRewriter重写法让检索命中率暴涨25%，代码已开源

显示全部楼层

兄弟们，最近RAG领域又一个硬核项目出炉了——LongRewriter，来自中科大和腾讯的联合研究。不是什么花哨概念，就是实实在在地优化了检索到生成之间的“翻译”环节。

目前大多数RAG系统在检索阶段用的是原始查询，但用户意图往往模糊、短小，导致检索命中率拉胯。LongRewriter的思路很简单：把用户query转译成更利于检索的长文本形式，而不是传统query重写那套短query扩展。

实测数据：在MultiHopQA和HotpotQA这类多跳推理数据集上，Top-5检索命中率提升了25%+，生成准确率提升约18%。核心原理是利用LLM建模“理想检索文档”的分布，训练了一个轻量的长文本改写模型，参数量仅7B，单次推理延迟低于100ms。

重点来了：代码和模型权重都在GitHub上开源了（搜索LongRewriter），基于Llama-3.1-8B微调，部署门槛中等，单卡A100可跑。建议正在做企业级RAG的兄弟重点关注，尤其涉及复杂业务逻辑的场景，这个改写层能大幅提升召回质量。

说句实在的，RAG现在最大的瓶颈不在生成，就在检索这一下。LongRewriter的处理方式，比单纯加reranker成本低、可解释性强。有兴趣的可以跑个线下测试，对比传统Hybrid Search效果，差距肉眼可见。

RAG性能突破：LongRewriter重写法让检索命

LoRA微调新突破：仅需1%参数，效果媲美全量

实测DeepSeek V3的Prompt技巧：这5个模式让

多模态新突破：LLaVA-NeXT-Interleave开源

DeepSeek开源MLA破局：推理显存砍半，长上

RAG新范式：自适应检索+动态知识修剪，检索

深度实测：国产大模型在长文本推理上的真实

开源模型选型避坑指南：从Qwen2到Llama3，

AutoGen升级0.3：多Agent协同架构革新，开

RAG最新进展：Self-RAG+混合检索让回答准确

RAG性能突破：LongRewriter重写法让检索命中率暴涨25%，代码已开源