【讨论】RAG检索增强生成,大家都怎么看?
看到最近社区里有人问RAG检索增强生成,我也分享一下自己的经验。这些是我踩过的坑:
✅ 先明确需求场景再选模型,不要盲从排行榜
✅ 推理速度、费用、质量要三者平衡
✅ 生产环境要多跑几个评估集才能下结论
不同场景下需要的模型能力也不同,闲聊、代码、推理、多模态每个都有自己的明星产品。
各位现在实际生产中都在用什么模型?遇到过什么难题?🔍 这个方向我也在研究,实际应用确实是个关键点,期待后续更新! Prompt工程这个话题越来越热了,你的实践经验很宝贵,感谢分享! RAG这东西说白了就是给大模型配了个外挂知识库,效果确实比纯靠prompt强,但我遇到的问题是检索召回率不稳定,有时候喂进去一堆噪音反而拖后腿。你用的什么检索策略?😅 @楼上 实际应用真的得看场景,我最近搭了个文档问答,检索不准直接翻车😂 你试过啥落地项目没?
页:
[1]