Stable Cascade高度压缩模型

[复制链接]
shofans 发表于 2024-9-18 15:24:11 | 显示全部楼层 |阅读模式
shofans
2024-9-18 15:24:11 132 0 看全部

微信扫码快速注册,学习AIGC更多知识

您需要 登录 才可以下载或查看,没有账号?立即注册

x
001.jpg

cascade模型介绍

该模型建立在 Würstchen 架构之上,它与 Stable Diffusion 等其他模型的主要区别在于,它工作在更小的潜在空间中。

为什么这很重要?潜在空间越小,推理速度越快,训练成本越低。

潜在空间有多小?Stable Diffusion 使用 8 的压缩因子,将 1024x1024 图像编码为 128x128。

Stable Cascade 实现了 42 的压缩因子,这意味着可以将 1024x1024 图像编码为 24x24,同时保持清晰的重建。

然后在高度压缩的潜在空间中训练文本条件模型。该架构的先前版本比 Stable Diffusion 1.5 的成本降低了 16 倍。

因此,这种模型非常适合效率很重要的用途。

此外,所有已知的扩展,如微调、LoRA、ControlNet、IP-Adapter、LCM 等,都可以使用此方法实现。



基础模型下载及基础工作流:点击学习

控制等高级工作流:点击学习


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 返回列表

shofans当前离线
管理员

查看:132 | 回复:0

欢迎
快速回复 返回顶部 返回列表