Stable Diffusion 3是什么?
Stable Diffusion 3 是由Stability AI推出的最新文本到图像模型,模型参数范围从 800M 到 8B,可适配不同类型设备,并称是迄今为止“最强大的文本到图像模型”。
Stable Diffusion 3 采用了类似Sora的新架构Diffusion Transformer ,结合了新技术 Flow Matching ,大大提高了多主题提示、图像质量、拼写能力的性能。
这个模型在多主题提示、图像质量和拼写能力方面有了显著的性能提升,特别擅长处理包含多个主题的复杂提示,能够生成更加精细和逼真的图像。
非常大的变化是,提示词支持使用自然语言了。例如下面的示例:
Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3” made out of colorful energy.
提示词:史诗般的动漫艺术作品,一个巫师在夜晚的山顶上向黑暗的天空施放了一个宇宙咒语,上面写着“Stable Diffusion 3”,由五颜六色的能量组成。
Stable Diffusion 3生成图片示例
以下是官方发布的生成示例,确实在多主题提示、图像质量上有很大的提升。
Stable Diffusion 3适用人群
Stable Diffusion 3适用于需要快速、高效地从文本生成高质量图像的个人、开发者和企业。无论是艺术家寻求灵感、开发者构建应用程序,还是企业需要生成独特的视觉内容,Stable Diffusion 3都提供了一个强大的工具。
如何使用Stable Diffusion 3?
AIHub 2024 年 04 月 18 日最新消息,Stable Diffusion 3 API 正式开放,开发者们可以接入使用了。
Stable Diffusion 3 API 通过 Stability AI 开发者平台提供服务。
AIHub 2024 年 6 月 12 日最新消息,Stable Diffusion 3 Medium模型正式开源,下载地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium
了解更多信息,请前往官方博客:https://stability.ai/news/stable-diffusion-3