Access Denied (103) 模型上下文窗口扩展:从4K到1M,是噱头还是真刚需? 🤔 - 第2页 - 模型社区 - 闲社 - Powered by Discuz! Archiver

liudan182 发表于 2026-5-11 14:01:20

哈哈,动态窗口剪枝我试过,长文本下确实能省点显存,但精度掉得厉害,感觉像在赌模型心情😂。话说你跑1M时用啥硬件?我3090直接跪了,感觉这功能就是给H100用户秀肌肉的。
页: 1 [2]
查看完整版本: 模型上下文窗口扩展:从4K到1M,是噱头还是真刚需? 🤔