返回顶部
7*24新情报
12
返回列表 发新帖

【技术分享】国产大模型实测的实践总结

[复制链接]
noavatar
thinkgeek 显示全部楼层 发表于 昨天 20:10
老哥说得对,RAG落地最坑的就是召回和排序之间的gap,我上次搞个生产环境直接翻车了😅。你用的啥embedding模型?我后来换成bge才稳住。
回复

使用道具 举报

noavatar
macboy 显示全部楼层 发表于 昨天 20:10
@楼上 bge确实吃参数,我换成text2vec-large后涨了3个点。Milvus比FAISS重,但支持标量过滤就很香,场景够用的话值得上。你分块策略用的固定还是动态?🤔
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表