Midjourney是什么?基础原理及用法(附效果图)
Midjourney是什么?
Midjourney是一款AI制图工具,只要关键字,就能透过AI算法生成相对应的图片,只需要不到一分钟。
可以选择不同画家的艺术风格,例如安迪华荷、达芬奇、达利和毕加索等,还能识别特定镜头或摄影术语。
有别于谷歌的 Imagen和OpenAI的DALL.E,Midjourney是第一个快速生成AI制图并开放予大众申请使用的平台。
Midjourney生成的作品往往带有电脑生成的痕迹,比较不会被当成假新闻素材,但对色情、血腥、暴力创作题材的审核还不够精准。
例如,输入“一棵长着立方体形桃子的大树”,就会生成四张不同图像供选择。
1、了解Midjourney的基础原理
Midjourney的心法秘诀在于:AI对具象的概念理解远胜于抽象的概念。
不是说它不能理解抽象概念,而是如果AI没见过什么是【抽象主义】画作,那么它是不会知道抽象到底抽象的是什么,没给它见过梵高的画,它不会理解什么是梵高的画风;它所能理解的一切在于:见过什么数据。
2、Midjourney的固定格式
Midjourney AI绘画的秘诀在于如何撰写提示词(Prompt),Prompt可以是关键词组合,也可以是一句话的描述,Prompt关键词只是武学秘籍里面一招一式,金庸和古龙告诉我们,看懂了一招一式是学不会 武功的,Midjourney AI真正的武学秘籍是:
AI绘画提示词的结构,比如:
two young boys, one short with long blonde and one tall with black hair hair, sorting cards on a white table in a classroom, cartoonish
我们对这个提示词分析、抽象,可以发现它由:绘画的主体、风格、光线角度、相机参数、渲染参数等组成,我们一个一个来分析:
- 主体:这个通常就需要是具体的描述,比如 "two young boys"(两个小男孩)
- 主体的特征:通常是对主体的修饰词,比如:“大大的眼睛”,“蓝色的耳环”,“黑色的头发”等等,在上面这个例子中就是"one short with long blonde and one tall with black hair hair"(一个长着一头金发的矮个子,一个长着一头黑发的高个子)
- 内容风格:内容的特性描述,通常是抽象的,一般是AI能力理解的专业词汇,比如:cartoonish
- 艺术流派:如抽象主义、显示主义、魔幻
- 艺术家或者作品:如潘天寿、宫崎骏、梵高等等
- 画风:如中国画、油画、插画等
- 内容特点:有时候和风格也很难分割,主要描述你这张画作的整体特性,比如:“高度真实的人像”
- 光线:画面光照的秒睡,通常是专业词汇,比如:
- 体积照明 volumetric lighting
- 冷光 cold light
- 情绪照明 mood lighting
- 明亮的 bright
- 柔和的照明/柔光 Soft illuminaotion/ soft lights
- 角度:整体画面的视角描述,一般也是专业词,比如:
- 乌瞰图 A bird's-eye view,aerial view
- 顶视園 Top view
- 倾斜移位 tilt-shift
- 相机参数:AI的强大之处在于,你可以给他设置相机参数,如:
- 相机名:如kodak portra 800
- 焦距光圈:35mm,
- 宽高比:16:9,9:16,2:3等
- 分辨率:4K,8K,16K,32K
- 渲染参数,如:
- 虚幻引擎 Unreal Engine
- OC渲染 octane render
- 渲染 Maxon Cinema 4D
- 建筑渲染 architectural visualisation
- 室内渲染 Corona Render
- 真实感 Quixel Megascans Render
- 其他模型参数组成,如种子,-s等
这些可能也不是标准,而只是我自己根据观察总结出来的,总之一句话:
Prompt是一定规则组成的关键词序列
3、提炼Midjourney基础格式
- 基于上一节总结的武学秘籍,很多人看了都会头晕,有没有简单的?我想很多人都总结出来了,Prompt其实就是:
Prompt=内容 + 风格 + 参数 - 内容就是画什么内容,长什么样,是主体、特征、内容的整体特点;
- 风格就是外在画风、环境因素,是光线、角度、相机参数、渲染引擎:这些内容的
- 参数描述就是画的尺寸大小、Midjourney的软件参数等,是宽高比、分辨率、图文相关性、其他模型参数等等
我们在创作的时候,遵循这个套路,就得到想要的照片。
4、实战
a cat,渲染之后是这样的:
- a cat, disney,cartoon,3d style,这次我们加入“迪斯尼卡通,3D风格”。效果是这样:
-
- a cat, disney,cartoon,3d style, cinema lights,edge lighting, soft focus,solid color background,light and dark contrast,cute,--v 5 这次加入“可爱,影院灯光,边缘照明,柔和对焦,纯色背景,明暗对比”各种乱七八糟的,效果是这样:
- a lovely cat,Disney Pixar Cartoon,3d style, cinema lights,edge lighting, soft focus, --v 5,这次我们对猫猫加入了“lovely”修饰词,并且“明暗对比”去掉了
怎么样?有没有被惊艳到
5、Midjourney几个重要的参数
- --ar,生成图像的宽高比,比如9:16,2:3等,用法:--ar 9:16,中间一定要有空格
- --v,选择midjourney版本,目前最新是v5,用法:--v 5,一样有空格,默认是v4,v5算法模型更好,生成图片质量更高
- --iw,参照图片的权重,什么意思呢,有时候你需要参考一张照片,如果你想保留更多原图(参考图)信息,这个值就设置大一点,范围~,用法 --iw 1
- --q,质量,要花费多少时间渲染,范围:,,1,2,值越高渲染成本越高,质量越好,当日不是适合所有情况
- --niji,midj官方提供的更适合动漫生成的模型,如果有需求,可以开启这个