Stable Cascade高度压缩模型

shofans · 发表于 2024-9-18 15:24:11

微信扫码快速注册，学习AIGC更多知识

您需要登录才可以下载或查看，没有账号？立即注册

x

cascade模型介绍

该模型建立在 Würstchen 架构之上，它与 Stable Diffusion 等其他模型的主要区别在于，它工作在更小的潜在空间中。

为什么这很重要？潜在空间越小，推理速度越快，训练成本越低。

潜在空间有多小？Stable Diffusion 使用 8 的压缩因子，将 1024x1024 图像编码为 128x128。

Stable Cascade 实现了 42 的压缩因子，这意味着可以将 1024x1024 图像编码为 24x24，同时保持清晰的重建。

然后在高度压缩的潜在空间中训练文本条件模型。该架构的先前版本比 Stable Diffusion 1.5 的成本降低了 16 倍。

因此，这种模型非常适合效率很重要的用途。

此外，所有已知的扩展，如微调、LoRA、ControlNet、IP-Adapter、LCM 等，都可以使用此方法实现。

基础模型下载及基础工作流：点击学习

控制等高级工作流：点击学习