三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

2023-04-1510:49:35人工智能与大数据Comments1,107 views字数 3708阅读模式

生成式 AI 风暴中,三种文本转图像模型脱颖而出:Stable Diffusion、Midjourney 和 DALL·E 2。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

简单来说,通过本文您能够确定哪一个最适合您的工作流程。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

Stable Diffusion

如果您正在寻找开源图像生成器,Stable Diffusion 是目前三者中唯一的选择。你可以在你的计算机上本地运行 Stable Diffusion,这意味着你有更多的控制权、更好的定制,甚至可以使用他们的深度学习文本转图像模型构建你自己的 AI 工具。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

因为它是开源的,所以出现了许多工具/公司,允许您直接从 Web 浏览器访问 Stable Diffusion。我们将在本文使用 Lexica,因为它内置了搜索聚合器和生成器!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

  • 生成步骤
  1. 如果您还没有帐户,请转到 lexica.art 并创建一个帐户。
  2. 在“Describe your image” 框中输入您要创建的内容的提示。

3.(可选)针对您不想在图像中看到的内容输入负面提示。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

  1. 点击“生成“按钮生成图像。
三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

可以看到,这是多么简单!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

  • Stable Diffusion 有什么用

由于 Stable Diffusion 是开源的,并且允许进行一些非常高度的定制,您可以使用您自己的模型对其进行训练并突破您的想象力极限。Lexica 通过他们自己的“Aperture”模型做到了这一点。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

如果您预算十分有限,Stable Diffusion 也非常有用。有很多方法可以免费访问 Stable Diffusion(搜索“SD Replicate”以获得即时选项)。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

一些自定义模型(如 Aperture)也击败了其他AI 生成工具,因为它们专门针对人类和库存图像进行了训练。例如,查看下面的例子:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

Manju Warier, An astronaut in a garden on a spring day, by martine johanna and simon stalenhag and chie yoshii and casey weldon and wlop : : ornate, dynamic, particulate, rich colors, intricate, elegant, highly detailed, harper's bazaar art, fashion magazine, smooth, sharp focus, 8 k, octane render文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

Midjourney

Midjourney 不像 Stable Diffusion 那样开源,但它仍然很神奇,尤其是对于更多艺术图像。它在生成与艺术家创作的图像相似的图像方面大放异彩。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

  • 生成步骤
  1. 加入 MJ Discord:https: //discord.gg/midjourney
  2. 加入 Discord 后,它会问你几个问题来验证你自己。
  3. 如果您想直接从 Midjourney 更详细地了解它们的功能,请阅读#getting-started 模块。
  4. 访问任何 #newbies 频道。
  5. 在底部的聊天文本框中输入 /imagine ,然后输入您的提示。
  6. 按键盘上的 Enter 键,即可看到提示出现!

这相当于“免费版”。您可以用它来测试 Midjourney 风格是否适合您的口味。您还可以查看社区中其他人生成的炫酷图像。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

Midjourney 提示需要一些不同于 Stable Diffusion 的工程。学习这一点的最好方法是通过不断尝试来了解如何微调图像以获得您想要的效果。让我们尝试使用之前的相同提示:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

Manju Warier, An astronaut in a garden on a spring day, by martine johanna and simon stalenhag and chie yoshii and casey weldon and wlop : : ornate, dynamic, particulate, rich colors, intricate, elegant, highly detailed, harper's bazaar art, fashion magazine, smooth, sharp focus, 8 k, octane render文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

与上面的 Stable Diffusion 相比,这可能看起来不太好,但您可以继续尝试不同的变化并及时更改,直到找到满足您需求的图像。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

总而言之,Midjourney 非常适合初学者,因为即使是其最高级的功能也非常易于使用。Discord 服务器附带许多易于访问和理解的说明、支持和设置。更多生成的定价也非常实惠(起步价为8美元/每月)。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

一个带提示的例子

让我们用相同的提示让他们正面交锋,并更好地了解他们如何不同。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

Prompt #1
wide shot of a chaotic arcade at night, anime line art by hayao miyazaki, multi-panel comic, a woman wearing streetwear playing an arcade game, sci-fi, manga panels, light novel style, dark red colors文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

Stable Diffusion:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

Midjourney:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

DALL·E 2:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

DALL·E 2

与 Midjourney 一样,DALL·E 2 不是开源的,但它有一个 API。您可以立即开始使用它,看看这其生成的图像与 Stable Diffusion 和 Midjourney 有何不同。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

  • 生成步骤
  1. 访问 https://labs.openai.com/ 并创建一个帐户(如果您还没有)。
  2. 在文本框中键入您的提示。
  3. 按“Generate”或可选地按“Surprise me”。
三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

我们依然使用相同的提示:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

Manju Warier, An astronaut in a garden on a spring day, by martine johanna and simon stalenhag and chie yoshii and casey weldon and wlop : : ornate, dynamic, particulate, rich colors, intricate, elegant, highly detailed, harper's bazaar art, fashion magazine, smooth, sharp focus, 8 k, octane render文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

如您所见,结果并不是那么好。但我们可以微调提示并重试。然而,艺术效果图并不是 Dall-E 的强项。它缺乏定制和高级功能,但价格非常实惠!虽然,在每张图片的基础上,跟踪起来可能会稍微困难一些。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

它真正非常擅长的是照片写实主义。而且提示往往没有那么复杂。让我们尝试一些非常简单的事情。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

a portrait of a cat in italy文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

让我们在 Midjourney 中尝试相同的提示:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

现在,看看 Stable Diffusion的效果:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

如您所见,DALL·E 2 在逼真图像和简洁提示方面拥有三者中最好的效果。并不是说您无法通过 Stable Diffusion 或 MidJourney 获得类似的结果,您只需要学习一些有关提示工程的知识。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

Prompt #2
multi-panel comic, anime line art by hayao miyazaki, light novel style, a nerdy girl is programming at a computer in a room full of gadgets, art station, outlined silhouettes, dramatic lighting, masterpiece, dark blue colors文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

Stable Diffusion:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

Midjourney:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

DALL·E 2:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

Prompt #3
comic panel, anime line art, Vintage 90's anime style environmental wide shot of a sketchy alleyway at night; a woman wearing a hood and sitting while reading a book; by Hajime Sorayama, Greg Tocchini, Virgil Finlay, sci-fi. line art. cyberpunk art文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

Stable Diffusion:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

Midjourney:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

DALL·E 2:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

Prompt #4
ethereal interdimensional portal in the forest by jean giraud + beeple + insanely detailed, illustrated by kentaro miura, poster, peter mohrbacher, pastel color, symmetrical Stable Diffusion:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

Stable Diffusion:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

Midjourney:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

DALL·E 2:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

总结

所有这些 AI 图像生成器都有自己的优势,可以根据您的需求提供出色的体验。阅读本文后,我鼓励您访问所有站点并亲自尝试一下。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

探索他们的长处,自己测试,看看事物与你自己的体验相比如何。最终,有了对您想要创建的内容的明确想法和超级清晰的提示,无论您使用哪个平台,您都会收到一些很酷的东西。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

除了上面我刚刚与您分享的之外,如果我告诉您您可以结合使用三种 AI 工具的优势来生成一张巨型图像来战胜它们呢?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

这是我使用所有三种工具创建的示例:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

三种文本转图像模型:Stable Diffusion、Midjourney、DALL·E 2

本文原作者 Meta Mae,中文由博雅数智翻译。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html

文章源自菜鸟学院-https://www.cainiaoxueyuan.com/ai/33723.html
  • 本站内容整理自互联网,仅提供信息存储空间服务,以方便学习之用。如对文章、图片、字体等版权有疑问,请在下方留言,管理员看到后,将第一时间进行处理。
  • 转载请务必保留本文链接:https://www.cainiaoxueyuan.com/ai/33723.html

Comment

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定