闲社

标题: Stable Diffusion 3.5开源实测：10秒出图，中文Prompt表现炸裂 [打印本页]

作者: sky8oy 时间: 昨天 21:01
标题: Stable Diffusion 3.5开源实测：10秒出图，中文Prompt表现炸裂
兄弟们，今天聊聊Stable Diffusion 3.5（SD3.5）的最新进展。上周Stability AI放出了SD3.5的正式版，我第一时间在本地跑了一遍，直接说干货。

**模型架构升级，效率拉满**

SD3.5这次采用了全新的MMDiT（Multimodal Diffusion Transformer）架构，相比SDXL的UNet，参数量缩减了30%，但推理速度提升明显。我用一张RTX 4090实测，512x512分辨率下，10步推理仅需8-10秒，比SDXL快40%左右。而且显存占用从8GB降到5.5GB，8GB卡也能轻松跑。

**中文Prompt破圈，细节惊人**

关键点来了：SD3.5原生支持多语言Prompt，我试了“一只熊猫在雨中打伞，水墨风格，背景有模糊的远山”，生图质量直接秒杀SDXL的英文直译效果。文字生成（比如海报上的中文标题）准确率从SDXL的40%提升到85%以上，这对国内用户太实用了。

**避坑指南：**

1. 下载一定选“sd3.5_large_fp16.safetensors”这个版本，其他分支容易翻车。
2. 用ComfyUI最新版，Workflow里把“guidance_scale”调到4.5-5.0效果最好，过高会过曝。
3. 默认CFG对复杂场景支持一般，建议结合ControlNet做人物姿势控制。

目前社区讨论最火的是“中文书法生成”和“古风场景”，已有大神放出LoRA微调方案。想尝鲜的，GitHub搜“sd3.5_demo”有官方Colab。

欢迎光临闲社 (https://www.xianshe.com/)