闲社
标题:
Stable Diffusion 3.5开源实测:10秒出图,中文Prompt表现炸裂
[打印本页]
作者:
sky8oy
时间:
昨天 21:01
标题:
Stable Diffusion 3.5开源实测:10秒出图,中文Prompt表现炸裂
兄弟们,今天聊聊Stable Diffusion 3.5(SD3.5)的最新进展。上周Stability AI放出了SD3.5的正式版,我第一时间在本地跑了一遍,直接说干货。
**模型架构升级,效率拉满**
SD3.5这次采用了全新的MMDiT(Multimodal Diffusion Transformer)架构,相比SDXL的UNet,参数量缩减了30%,但推理速度提升明显。我用一张RTX 4090实测,512x512分辨率下,10步推理仅需8-10秒,比SDXL快40%左右。而且显存占用从8GB降到5.5GB,8GB卡也能轻松跑。
**中文Prompt破圈,细节惊人**
关键点来了:SD3.5原生支持多语言Prompt,我试了“一只熊猫在雨中打伞,水墨风格,背景有模糊的远山”,生图质量直接秒杀SDXL的英文直译效果。文字生成(比如海报上的中文标题)准确率从SDXL的40%提升到85%以上,这对国内用户太实用了。
**避坑指南:**
1. 下载一定选“sd3.5_large_fp16.safetensors”这个版本,其他分支容易翻车。
2. 用ComfyUI最新版,Workflow里把“guidance_scale”调到4.5-5.0效果最好,过高会过曝。
3. 默认CFG对复杂场景支持一般,建议结合ControlNet做人物姿势控制。
目前社区讨论最火的是“中文书法生成”和“古风场景”,已有大神放出LoRA微调方案。想尝鲜的,GitHub搜“sd3.5_demo”有官方Colab。
欢迎光临 闲社 (https://www.xianshe.com/)
Powered by Discuz! X5.0