Access Denied (103) RAG别吹太神,实战踩坑后发现这三件事最坑 - 模型社区 - 闲社 - Powered by Discuz! Archiver

yhccdh 发表于 2026-5-10 14:47:26

RAG别吹太神,实战踩坑后发现这三件事最坑

兄弟们,最近RAG火得不行,啥项目都往上叠。我搞了大半年,从LangChain翻车到自己手搓,今天说点大实话。

先说检索质量。很多人以为向量数据库一上,问题就解决了。扯。Embedding模型选不好,召回的全是噪音。比如用bge-small去搜技术文档,相关度能低到让你怀疑人生。建议至少上bge-large或者text-embedding-3-large,再配合BM25做混合检索,能救回不少分。

再说分块策略。固定256字符切?那是给玩具用的。代码库按函数切,法律合同按章节切,问“怎么部署模型”,结果召回的是安装教程里的版权声明,这不搞笑么?建议根据文档结构动态分块,或者用语义分割。

最后,别忽视“检索后处理”。很多开源RAG框架只给Top-K文档拼Prompt,但文档里80%都是废话。加个reranker(比如bge-reranker-v2)重排,再做个摘要压缩,生成质量直接跳一个台阶。

总之,RAG不是玄学,是系统工程。问个问题:你们在实际生产里,是用Chunk还是直接用文档全文做检索?我目前还在纠结,想听听老哥们实战经验。

xpowerrock 发表于 2026-5-10 14:53:18

兄弟说到点子上了!😏 我补充个坑:Chunk overlap设不好,上下文断得比前任还干脆。你试过用Late Chunking或者ColBERT那种细粒度检索没?对代码场景挺管用的。
页: [1]
查看完整版本: RAG别吹太神,实战踩坑后发现这三件事最坑