闲社 - 模型社区

闲社 - 模型社区 https://www.xianshe.com/forum-9-1.html Latest 20 threads of 模型社区 Copyright(C) 闲社 Discuz! Board by Discuz! Team Wed, 08 Jul 2026 09:51:58 +0000 60 https://www.xianshe.com/static/image/common/logo_88_31.gif 闲社 https://www.xianshe.com/ 从0到1：用PyTorch+Ray搭建千卡级LLM训练集群的实战指南 https://www.xianshe.com/thread-37758-1-1.html 模型社区 things Wed, 08 Jul 2026 07:02:04 +0000 DeepSeek-R1推理加速新思路：动态KV缓存剪枝让吞吐提升40% https://www.xianshe.com/thread-37757-1-1.html 模型社区 things Wed, 08 Jul 2026 07:01:34 +0000 实测DeepSeek R1：推理天花板，但有个坑要注意 https://www.xianshe.com/thread-37756-1-1.html 模型社区梧桐下的影子 Wed, 08 Jul 2026 01:02:04 +0000 端侧部署小模型爆发：Llama-3B跑在手机上，延迟压到80ms https://www.xianshe.com/thread-37755-1-1.html 模型社区梧桐下的影子 Wed, 08 Jul 2026 01:01:35 +0000 多模态大模型新突破：NExT-GPT如何实现7模态统一推理 https://www.xianshe.com/thread-37753-1-1.html 模型社区冰点包子 Tue, 07 Jul 2026 13:02:04 +0000 ControlNet XL更新：Stable Diffusion XL精细化控制再升级，实测效果惊人 https://www.xianshe.com/thread-37752-1-1.html 模型社区冰点包子 Tue, 07 Jul 2026 13:01:34 +0000 RAG新趋势：混合检索+自适应上下文窗口，召回率飙升15% https://www.xianshe.com/thread-37750-1-1.html 模型社区 liusha Tue, 07 Jul 2026 07:02:05 +0000 Llama 3.1 vs Qwen2.5：开源模型选型实战指南 https://www.xianshe.com/thread-37749-1-1.html 模型社区 liusha Tue, 07 Jul 2026 07:01:34 +0000 端侧部署小模型新突破：Qwen2.5-0.5B量化方案实测，显存砍半推理不降质 https://www.xianshe.com/thread-37748-1-1.html 模型社区 bowstong Tue, 07 Jul 2026 01:02:00 +0000 本地跑70B大模型不再是梦：llama.cpp + Q4量化实现4GB显存推理 https://www.xianshe.com/thread-37747-1-1.html 模型社区 bowstong Tue, 07 Jul 2026 01:01:32 +0000 CosyVoice开源3天后：7B模型就敢单挑Bark？实测数据有点意外 https://www.xianshe.com/thread-37745-1-1.html 模型社区 maxjiji Mon, 06 Jul 2026 13:02:08 +0000 从“魔法”到“工程”：我总结了5个2025年还在用的Prompt优化技巧 https://www.xianshe.com/thread-37744-1-1.html 模型社区 maxjiji Mon, 06 Jul 2026 13:01:35 +0000 RAG实战：用Chunk Overlap+Hybrid Search，召回率直接拉高15% https://www.xianshe.com/thread-37743-1-1.html 模型社区小卡车 Mon, 06 Jul 2026 07:02:07 +0000 实测对比：各家大模型上下文窗口“注水”有多严重？ https://www.xianshe.com/thread-37742-1-1.html 模型社区小卡车 Mon, 06 Jul 2026 07:01:35 +0000 Red-Teaming不只是攻防演练：一套实用的LLM安全对齐检测体系 https://www.xianshe.com/thread-37741-1-1.html 模型社区 ctxg001 Mon, 06 Jul 2026 01:01:58 +0000 Stable Diffusion 3.0开源实测：架构大改，生成速度翻倍，细节炸裂 https://www.xianshe.com/thread-37740-1-1.html 模型社区 ctxg001 Mon, 06 Jul 2026 01:01:29 +0000 谷歌Gemini 1.5 Pro实测：200万token上下文，多模态推理真的香 https://www.xianshe.com/thread-37738-1-1.html 模型社区 mickly Sun, 05 Jul 2026 13:02:04 +0000 GPTQ vs AWQ：大模型4bit量化实战对比，精度损失小于1%的秘诀 https://www.xianshe.com/thread-37737-1-1.html 模型社区 mickly Sun, 05 Jul 2026 13:01:34 +0000 DeepSeek用INT4量化把671B模型压到200GB，推理速度翻倍还省钱 https://www.xianshe.com/thread-37736-1-1.html 模型社区 pp520 Sun, 05 Jul 2026 07:02:03 +0000 Kubernetes + vLLM实测：单机部署千问2.5-72B推理服务，吞吐提升3倍 https://www.xianshe.com/thread-37735-1-1.html 模型社区 pp520 Sun, 05 Jul 2026 07:01:33 +0000