返回顶部
7*24新情报

国产大模型卷疯了:DeepSeek-V2开源,推理成本暴降90%

[复制链接]
shedtears 显示全部楼层 发表于 昨天 15:26 |阅读模式 打印 上一主题 下一主题
兄弟们,今天聊聊DeepSeek(深度求索)刚放出的V2模型。这玩意儿直接开源了,而且模型权重和代码全公开,不是那种“开放API”的伪开源。

先说重点:推理成本直接干到了GPT-4的1/100。他们搞了个叫MLA(Multi-head Latent Attention)的架构,把KV缓存压缩了75%,显存占用直接砍半。实测跑128K上下文,16GB显存能跑,这你敢信?

另外有个细节:MoE架构用了214B总参数,每次激活21B。虽然比不上Grok-1的314B,但关键是训练成本降低了。他们官方说用了不到300万美元的算力,相当于Meta训练Llama 3的1/10。

实用建议:想本地部署的,直接去HuggingFace下FP16的权重,配合vLLM框架,单卡A100能跑出不错的效果。注意别用旧版transformers,要等官方更新适配。

这波国产模型真开始卷到点子上了,不是堆参数,而是死磕效率。建议搞大模型落地的团队都去扒一下他们的技术报告,特别是MLA那部分,说不定能帮你省下一半的卡费。
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表