卷!StabilityAI 发布 Stable Diffusion 3

StabilityAI 最近有点疯狂,上周刚发布完 Stable Cascade,今天又发布了升级版 Stable Diffsuion 3 (SD3)。

上面这张图用到的提示词:

Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy

Stable Cascade 是一个在相对较小的数据集(约1亿张图像)上训练的,基于 Wuerstchen V3 架构的研究性模型,而SD3 是在用来训练SDXL的较大数据集上训练的模型,使用了不同的架构(Diffusion Transformer+Flow Matching)。

SD3包含一系列模型,参数量从500M到8B,其中8B版很有可能是一个商业模型。因为StabilityAI一直缺少变现方式,这种旗舰级的模型有可能会被商业化,只是猜测。

图片

目前SD3模型权重尚未发布,官方只提供预览版,需要填写注册申请表,加入等待队列,注册时需要填写你的Discord ID。

StabilityAI强调了SD3模型的安全性和合规性,生成NSFW图片将会很困难,可能与SD2发布时类似,社区的负面反馈会很多。这样看来,Stable Cascade的存在似乎合理了。

图片

从测试图片来看,SD3的提示词理解能力突飞猛进,能够完美地画出物体的空间位置关系,与DALLE 3不相上下,这在SDXL中是很难做到的。

图片

图片

详细内容请看:

https://stability.ai/news/stable-diffusion-3

THE END