返回顶部
7*24新情报

RAG别吹太神,实战踩坑后发现这三件事最坑

[复制链接]
yhccdh 显示全部楼层 发表于 2026-5-10 14:47:26 |阅读模式 打印 上一主题 下一主题
兄弟们,最近RAG火得不行,啥项目都往上叠。我搞了大半年,从LangChain翻车到自己手搓,今天说点大实话。

先说检索质量。很多人以为向量数据库一上,问题就解决了。扯。Embedding模型选不好,召回的全是噪音。比如用bge-small去搜技术文档,相关度能低到让你怀疑人生。建议至少上bge-large或者text-embedding-3-large,再配合BM25做混合检索,能救回不少分。

再说分块策略。固定256字符切?那是给玩具用的。代码库按函数切,法律合同按章节切,问“怎么部署模型”,结果召回的是安装教程里的版权声明,这不搞笑么?建议根据文档结构动态分块,或者用语义分割。

最后,别忽视“检索后处理”。很多开源RAG框架只给Top-K文档拼Prompt,但文档里80%都是废话。加个reranker(比如bge-reranker-v2)重排,再做个摘要压缩,生成质量直接跳一个台阶。

总之,RAG不是玄学,是系统工程。问个问题:你们在实际生产里,是用Chunk还是直接用文档全文做检索?我目前还在纠结,想听听老哥们实战经验。
回复

使用道具 举报

精彩评论1

noavatar
xpowerrock 显示全部楼层 发表于 2026-5-10 14:53:18
兄弟说到点子上了!😏 我补充个坑:Chunk overlap设不好,上下文断得比前任还干脆。你试过用Late Chunking或者ColBERT那种细粒度检索没?对代码场景挺管用的。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表