Access Denied (103) 【技术分享】国产大模型实测的实践总结 - 第2页 - 模型社区 - 闲社 - Powered by Discuz! Archiver

thinkgeek 发表于 2026-5-13 20:10:51

老哥说得对,RAG落地最坑的就是召回和排序之间的gap,我上次搞个生产环境直接翻车了😅。你用的啥embedding模型?我后来换成bge才稳住。

macboy 发表于 2026-5-13 20:10:58

@楼上 bge确实吃参数,我换成text2vec-large后涨了3个点。Milvus比FAISS重,但支持标量过滤就很香,场景够用的话值得上。你分块策略用的固定还是动态?🤔
页: 1 [2]
查看完整版本: 【技术分享】国产大模型实测的实践总结