闲社 › 开发社区 › 模型社区 › RAG实战经验：从Naive到Advanced，如何让LLM真正“看” ...

zam33393

发帖数33
粉丝0

此人很懒，什么也没有留下

阅读Ta更多精彩帖

7*24新情报

2026-06-10 [模型社区]

RAG实战经验：从Naive到Advanced，如何让LL

兄弟们，昨天我们团队刚把RAG系统从v1升级到v3，踩的坑和结果都很有料，分享出来供大

2026-06-10 [模型社区]

实测四大模型256K上下文：Claude写小说稳，

兄弟们，今天不整虚的。我拿一篇3万字的《三体》同人文，分别喂给GPT-4o、Claude 3.5

2026-06-10 [模型社区]

Prompt工程新范式：微软开源自动提示优化框

今天在AI社区里，微软亚洲研究院开源了一个叫“AutoPromptOptimizer”的Prompt工程工

2026-06-10 [模型社区]

LLM对齐新进展：ICLR 2025 spotlight论文揭

团队们好，今天聊个硬核的——模型安全与对齐。最近ICLR 2025一篇spotlight论文（http

2026-06-09 [模型社区]

蒸馏技术新突破：小模型也能吊打老师，四步

最近社区里关于模型蒸馏的讨论又热起来了，几篇新论文和开源项目让这项技术更接地气。

2026-06-09 [模型社区]

Meta Llama 3 实测：400B参数未开源，但8B

大家好，今天聊一个“虽迟但到”的消息。Meta 刚放出了 Llama 3 的技术报告（arXiv:24

2026-06-09 [模型社区]

Cline v3.0实测：MCP协议让AI编程助手“长

兄弟们，今天聊点干货。昨晚Claude Code的开源替代Cline发布了v3.0，最大改动是深度集

2026-06-09 [模型社区]

DeepSeek开源MoE训练框架，千亿级模型部署

兄弟们，今天必须聊聊DeepSeek刚开源的“DeepSeek-MoE-Training”框架。这玩意儿直接

2026-06-09 [模型社区]

Qwen2.5-72B跑分实测：指令遵循飙升40%，单

兄弟们，今天聊点实在的。阿里通义千问团队昨晚刚放出了Qwen2.5-72B的完整评测报告，

2026-06-09 [模型社区]

实测DeepSeek 2.5：性价比炸裂，长上下文推

兄弟们，最近DeepSeek 2.5模型上线后，我压榨了三天，今天来交个硬核作业。先说结论：

阅读排行

1 【版规】开发社区 - 版块介绍

2 AI赛道新浪潮：3D重建与大模型的融合时代

3 深入浅出：架构设计的艺术与挑战🤓

4 AI技术新风向：3D重建、模型革新与智能硬件的融合

5 AI赛道新风向：3D重建与模型革新引领未来🚀

6 openclaw的怎么升级

7 整理了一些学习资料

8 整理了一些学习资料

9 分享一些实用的开发工具

10 分享一些实用的脚本工具

RAG实战经验：从Naive到Advanced，如何让LLM真正“看”懂文档

[复制链接]

zam33393 显示全部楼层 发表于 2 小时前 |阅读模式

兄弟们，昨天我们团队刚把RAG系统从v1升级到v3，踩的坑和结果都很有料，分享出来供大家参考。

先说核心痛点：Naive RAG（简单分块+向量检索）在长文档和跨领域查询上表现拉胯。比如我们测试金融年报，Top-5召回率只有58%，LLM还得硬编答案。

我们换了几招：
1. **分块策略**：从固定512字符换成Semantic Chunking（基于句子边界+主题分割），召回率直接涨到73%。配合Metadata Filtering（标题/章节标签），查询速度提升40%。
2. **重排序层（Reranker）**：加了个轻量级Cross-Encoder（比如BAAI/bge-reranker-v2-m3），Top-3准确率飙到89%，幻觉减少明显。记得别用LLM做rerank，太慢了。
3. **查询重写**：用户问“三季报利润”这种模糊词，我们用小模型（如GPT-3.5-turbo）自动扩写成“2023年第三季度归母净利润同比变化”，召回再涨10%。

数据说话：v3上线后，用户满意度从61%升到84%，平均响应时间从4.5秒降到2.8秒（主要是去掉了冗余检索）。

建议搞RAG的兄弟优先试Reranker和分块优化，成本低收益高。有问题楼下聊。