Midjourney是什么？基础原理及用法（附效果图）

菜小编

设计达人

2023-6-25

Midjourney是什么？

Midjourney是一款AI制图工具，只要关键字，就能透过AI算法生成相对应的图片，只需要不到一分钟。

可以选择不同画家的艺术风格，例如安迪华荷、达芬奇、达利和毕加索等，还能识别特定镜头或摄影术语。

有别于谷歌的 Imagen和OpenAI的DALL．E，Midjourney是第一个快速生成AI制图并开放予大众申请使用的平台。

Midjourney生成的作品往往带有电脑生成的痕迹，比较不会被当成假新闻素材，但对色情、血腥、暴力创作题材的审核还不够精准。

例如，输入“一棵长着立方体形桃子的大树”，就会生成四张不同图像供选择。

1、了解Midjourney的基础原理

Midjourney的心法秘诀在于：AI对具象的概念理解远胜于抽象的概念。
不是说它不能理解抽象概念，而是如果AI没见过什么是【抽象主义】画作，那么它是不会知道抽象到底抽象的是什么，没给它见过梵高的画，它不会理解什么是梵高的画风；它所能理解的一切在于：见过什么数据。

2、Midjourney的固定格式

Midjourney AI绘画的秘诀在于如何撰写提示词（Prompt），Prompt可以是关键词组合，也可以是一句话的描述，Prompt关键词只是武学秘籍里面一招一式，金庸和古龙告诉我们，看懂了一招一式是学不会武功的，Midjourney AI真正的武学秘籍是：

AI绘画提示词的结构,比如：

two young boys, one short with long blonde and one tall with black hair hair, sorting cards on a white table in a classroom, cartoonish

我们对这个提示词分析、抽象，可以发现它由：绘画的主体、风格、光线角度、相机参数、渲染参数等组成，我们一个一个来分析：

主体：这个通常就需要是具体的描述，比如 "two young boys"(两个小男孩)
主体的特征：通常是对主体的修饰词，比如：“大大的眼睛”，“蓝色的耳环”，“黑色的头发”等等,在上面这个例子中就是"one short with long blonde and one tall with black hair hair"(一个长着一头金发的矮个子，一个长着一头黑发的高个子)
内容风格：内容的特性描述，通常是抽象的，一般是AI能力理解的专业词汇，比如：cartoonish
艺术流派：如抽象主义、显示主义、魔幻
艺术家或者作品：如潘天寿、宫崎骏、梵高等等
画风：如中国画、油画、插画等
内容特点：有时候和风格也很难分割，主要描述你这张画作的整体特性，比如：“高度真实的人像”
光线：画面光照的秒睡，通常是专业词汇，比如：
- 体积照明 volumetric lighting
- 冷光 cold light
- 情绪照明 mood lighting
- 明亮的 bright
- 柔和的照明/柔光 Soft illuminaotion/ soft lights
角度：整体画面的视角描述，一般也是专业词，比如：
- 乌瞰图 A bird's-eye view,aerial view
- 顶视園 Top view
- 倾斜移位 tilt-shift
相机参数：AI的强大之处在于，你可以给他设置相机参数，如：
- 相机名：如kodak portra 800
- 焦距光圈：35mm，
宽高比：16:9，9:16，2:3等
分辨率：4K，8K，16K，32K
渲染参数，如：
- 虚幻引擎 Unreal Engine
- OC渲染 octane render
- 渲染 Maxon Cinema 4D
- 建筑渲染 architectural visualisation
- 室内渲染 Corona Render
- 真实感 Quixel Megascans Render
其他模型参数组成，如种子，-s等

这些可能也不是标准，而只是我自己根据观察总结出来的，总之一句话：
Prompt是一定规则组成的关键词序列

3、提炼Midjourney基础格式

基于上一节总结的武学秘籍，很多人看了都会头晕，有没有简单的？我想很多人都总结出来了，Prompt其实就是：
Prompt=内容 + 风格 + 参数
内容就是画什么内容，长什么样，是主体、特征、内容的整体特点；
风格就是外在画风、环境因素，是光线、角度、相机参数、渲染引擎：这些内容的
参数描述就是画的尺寸大小、Midjourney的软件参数等，是宽高比、分辨率、图文相关性、其他模型参数等等

我们在创作的时候，遵循这个套路，就得到想要的照片。

4、实战

a cat，渲染之后是这样的：

a cat, disney，cartoon，3d style，这次我们加入“迪斯尼卡通，3D风格”。效果是这样：
a cat, disney，cartoon，3d style， cinema lights，edge lighting, soft focus,solid color background,light and dark contrast,cute，--v 5 这次加入“可爱，影院灯光，边缘照明，柔和对焦，纯色背景，明暗对比”各种乱七八糟的，效果是这样：

a lovely cat，Disney Pixar Cartoon，3d style， cinema lights，edge lighting, soft focus， --v 5，这次我们对猫猫加入了“lovely”修饰词，并且“明暗对比”去掉了

怎么样？有没有被惊艳到

5、Midjourney几个重要的参数

--ar，生成图像的宽高比，比如9:16，2:3等，用法：--ar 9:16，中间一定要有空格
--v，选择midjourney版本，目前最新是v5，用法：--v 5，一样有空格，默认是v4，v5算法模型更好，生成图片质量更高
--iw，参照图片的权重，什么意思呢，有时候你需要参考一张照片，如果你想保留更多原图（参考图）信息，这个值就设置大一点，范围～，用法 --iw 1
--q，质量，要花费多少时间渲染，范围：，，1，2，值越高渲染成本越高，质量越好，当日不是适合所有情况
--niji，midj官方提供的更适合动漫生成的模型，如果有需求，可以开启这个

THE END

Mac OS安装 Stable Diffusion，开启探索 AI 绘画奇妙世界

<<上一篇

Notion 转到 Obsidian：为什么选择 Obsidian 作为新的笔记软件？

下一篇>>