闲社

标题: Stable Diffusion 3.5发布，架构升级让细节和文字生成提升40%以上 [打印本页]

作者: yhylb03 时间: 昨天 21:01
标题: Stable Diffusion 3.5发布，架构升级让细节和文字生成提升40%以上
大家早上好，Stability AI 昨天默默放了个大招——正式开源了Stable Diffusion 3.5系列模型，包括2.5B、8B两个参数版本，以及一个轻量级的Turbo版本。实测跑了一圈，有几个关键点值得聊。

1. 架构核心变化：这次用的是全新的MMDiT-X架构，改进了文本-图像对齐机制。官方数据显示，在ArtBench和DrawBench上，文字渲染准确率相比SD3提升了约42%，复杂提示词（比如“一个写着‘AI Studio’的霓虹灯牌”）的细节还原度显著提升。

2. 性能与部署：2.5B版本在RTX 4090上单图生成约1.8秒（512x512，20步），显存占用约5.2GB。Turbo版本采用蒸馏技术，只需4步就能出图，实测质量接近20步水平，适合移动端或低成本推理。

3. 实用建议：如果你做商业插画或UI设计，建议直接上8B版本，其对光影和材质的表达更细腻。但要注意，SD3.5对负面提示词的敏感度提高了，需要调低权重（推荐0.3-0.5），否则容易过抑制细节。

最后，模型已在HuggingFace和GitHub开源，搭配ComfyUI或Diffusers直接可用。建议升级前备份原模型，避免冲突。有什么踩坑经验欢迎留言。

欢迎光临闲社 (https://www.xianshe.com/)