面对AIGC生图时代的到来,Midjourney 无疑是目前最火的一款AI绘图软件,简单的咒语就会生成让人惊艳的图片。在学习过程中大家会疯狂地求咒语,但是在具体的项目中,又会觉得 Midjourney 无法控制,得不到想要的图片。
今天这篇文章,就带大家从基础的控图四大招式聊起,到万能公式的八大方向,到控图七大参数,再到控图王炸技巧和落地项目,绝对干货满满。
Midjourney 是一种 AI 扩散模型,它通过我们输入的书面提示词,从噪音中创建图像。
记住并且掌握 Midjourney 的万能公式的八大方向是控图的必杀技!
「主体」+「媒介」+「环境」+「构图」+「灯光」+「风格」+「氛围」+「情绪」
(1)prompt 提示词咒语
提示词是万能公式的呈现基础,对于零基础的朋友们,在作图之前,让我们先来了解一下prompt。如果把Midjourney比喻成魔法世界,那么prompt就是魔法咒语。
简单来说prompt是Midjourney Bot 解释以生成图像的文字描述。 Midjourney Bot 将 prompt 中的单词和短语分解成为Token的较小部分,然后用于生成图像。所以提示词越详细、纬度越多的话魔法更强,就可以得到更加有魔力的图片。
(2)提示词咒语的结构组成
初级咒语:一个基本的提示可以简单到一个单词、短语或表情符号。
高级咒语:可以包括一个或多个图像链接、多个文本短语或单词,以及一个或多个后缀参数
接下来这部分主要讲解 Text prompt 咒语部分。
主体:人、动物、人物、地点、物体等。person, animal, character, location, object,
媒介:照片、绘画、插图、雕塑、涂鸦、挂毯等。photo, painting, illustration, sculpture, doodle, tapestry
环境:室内、室外、月球上、纳尼亚、水下、翡翠城等。indoors, outdoors, on the moon, in Narnia, underwater, the Emerald City
构图:顶视、人像、爆头、特写、鸟瞰图等。Top view,Portrait, headshot, closeup, birds-eye view,
灯光:柔光、环境、阴天、霓虹灯、工作室灯等。soft light, ambient, overcast, neon, studio lights
氛围:充满活力、柔和、明亮、单色、彩色、黑白、柔和等。vibrant, muted, bright, monochromatic, colorful, black and white, pastel
情绪:稳重、平静、喧闹、精力充沛等。Sedate, calm, raucous, energetic
风格:东方山水画、浮世绘、日本漫画风格、皮克斯、蒸汽朋克、新海诚、宫崎骏风格。Tradition Chinese Ink Painting,Japanese Ukiyo-e,Japanese comics/manga,Pixar,Steampunk,Makoto Shinkai,Miyazaki Hayao style
等等等
在Midjourney的世界里,提示词就是沟通的媒介,重要性不言而喻,接下来,推荐一些好用的提示词工具。
(1)Midjourney 官方文档
官网:https://docs.midjourney.com/docs/prompts
MidJourney 官方文档,神器必备!划重点!提供了关于 Midjourney 所有功能介绍,史上最全。很多人会忽略官方文档,就喜欢找各种教程,其实,你如果把官方文档全部看一遍就没有问题能难倒你。
(2)OPS
官网:https://moonvy.com/apps/ops/
我一直在用的一款工具,Midjourney提示词可视化并提供编辑功能的工具,方便好用提高效率。
可以显示英文提示词的中文翻译;可以随意拖动删除隐藏提示词;为提示词进行分类:普通、样式、质量、命令、画质等;可以导入自己的 Notion 提示词词典。
(3)MidJourney 提示助手
官网:https://promptfolder.com/midjourney-prompt-helper/
之前分享过,现在网站换了更加简洁浅色的UI啦。可以查看探索样式和复杂的 MidJourney 提示。在输入框中输入你的想法,自动转换成Ai生成的创意文本通过选择不同的艺术风格、颜色、灯光、镜头等选项进行定制,上传图片参考,让你更快地获取灵感,创作出更具创意的作品。
抛开自己天马行空的创作之外,如何将Midjourney落地到工作项目中呢?
在接到需求的时候,寻找合适的风格图片可以在提案阶段节省很多时间,并且让你的作品更加丰富和多样化。
接下来就让我们看看第三招无中生有——垫图大法!
第一步:需求关键词
下周计划去马尔代夫旅行浮潜摆烂,需要设计一组《夏日派对》运营海报。
以上就是需求背景,提取出关键词:马尔代夫、两个女孩、泡泡玛特。
two Girls of sunshine trend, Blind box style, pop mart, playful character design,Maldives, Swimming pool, hyper-realistic water, uhd image, octane render, C4D, 8K --s 400
第二步:输入垫图
找到想做的风格,比如想做日漫二次元风格、想做中国风、想做新海诚风格?
目前我想做中国风,所以收集一些风格图片,在命令框中放入找到的素材图。
第三步:垫图+关键词
在命令框中输入「/imagine」在描述词前面加上URL1+URL2+…+URL4,关键词
描述词:图片链接 two Girls of sunshine trend, Blind box style, pop mart, playful character design,Maldives, Swimming pool, hyper-realistic water, uhd image, octane render, C4D, 8K
第四步:海报完成
无中生有垫图大法完成,快乐的马尔代夫夏日派对海报完成!效率提升500%!
chaos 参数意为混乱,在 MJ 中使用 chaos 参数可以影响生成结果的变化程度。在提示词后添加 --chaos 或 --c 启用该功能,其数值选范围为 0-100,默认值为 0。chaos 数值越低,生成的结果在风格、构图上较相似;数值越高,风格、构图的差异会越大,会有让人意象不到的结果。
chaos 图片生成的效果
后缀描述:--chaos <值> 可以缩写为 --c <值>
范围:0-100,默认值为0
举个例子:
我们先随意生成一张图,这里我输入了“two girls” ,得到以下图片。
然后我们试试先赋予其 chaos 值,分别在描述词后分别加上“--c 1”、“--c 25”、“--c 50”、“--c 100”来看看出图的对比结果。
我们得到五张图放在一起做一下对比,可以看到 chaos 1下的女孩与原图有着相似的颜色、造型、站姿、容貌;而当 chaos 值越接近 100 时,其画面面容风格等细节都发生了更多样的变化。
因此,如果你想基于原图进行细微调整,那尽量保持chaos处于较小的数值下。
:: 作为分隔符可以让Midjourney 考虑两个或多个独立的概念,还可以为提示的各个部分指定相对重要的权重。
举个例子:
我输入一个“space ship ”太空船的关键词描述,我们得到一艘太空船。如果将提示分为两部分,即“space:: ship”,后得到以下图,可以看到这两个概念被分别考虑,从而创建一艘穿越太空的帆船。
接下来我还想让太空的元素更多,我同样通过该参数增加冰的权重,输入“ space::2 ship ”,我们就可以看到接下来的图,太空的元素变得更多了。
1.3 图片权重参数【--iw 】
--iw 图像权重的参数,常用于需要垫图的场景,数值会控制我们上传的垫图与提示此之间的比重。
Image Weight 图像权重
后缀描述:--iw <数值>
范围:0.5-2,默认值为 1
默认--iw 数值为 1,较高的 --iw 值意味着垫图的图片对生成的结果影响更大,数值范围为 0.5-2。
举个例子:
用上面“two girls”的图片垫图,分别基于这张图片生成了 0.5、1、2 权重的图片。放在一起对比后,我们可以看到权重为 2 的结果比权重为 0.5 的更加接近原始图片的效果。
提示词中使用 --no 负向权重参数,告诉midjourney哪些元素不要出现在画面中。比如我不想要花朵,不想要水果等。
--no 接受用逗号分隔的多个单词:--no item1,item2,item3,item4
举个例子:
我先输入“still life gouache painting”以生成一幅静物水粉画,但是我希望静物水画中不要出现任何水果!因此使用负向权重词输入“ still life gouache painting --no fruit ”得到没有水果的静物水彩画啦!
风格化参数可以让 Midjourney生成更具有艺术色彩、构图和形式的图像。风格化数值较低时,生成的图像与提示词匹配较高,但艺术性较差。反正,风格化数值较高时,生成的图像非常具有艺术性,但与提示词的联系较少。不同的数值生成的图片在细节上有较大的区别,大家根据图片效果可以选择合适的数值。
风格低 = --s 50,风格中 = --s 100,风格高 = --s 250,风格非常高 = --s 750
后缀描述: --stylize <值> 可以简写为 --s <值>
数值范围:0-1000,默认数值100
不同的 Midjourney 版本模型具有不同的风格化范围,只能在范围内输入数值。
举个例子:
先随意生成一张图 “two girls” ,然后我们试试先赋予其 stylize 值,分别在描述词后分别加上“--s 0”、“--s 50”、“--s 500”、“--s 750”、“--s 1000”来看看出图的对比结果。
我们得到六张图放在一起做一下对比,可以看到 s 0 的女孩风格更偏简洁,当 s 值越接近 1000 时,其画面质感细节更加丰富风格化更加突出。
1.6 种子值参数【--seed 】
Midjourney使用种子编号创建视觉噪声场(扩散模型的起始图片),作为生成初始图片网格的起点。种子数是为每个图片随机生成的,但可以使用--seed或 --sameseed参数指定。使用相同的种子编号和提示词生成相似的图片,利用这点我们可以生成连贯一致的人物形象或者场景。
后缀描述:--seed <值> 还可以为 --sameseed <值>
数值范围: 0–4294967295。
小技巧:如何获得seed种子?
(1)当生成一张图片后,点击图片右上角的表情符号(添加反应)。
(2)在弹窗中搜索“信封Envelope",点击第一个信封表情。
(3)在左侧菜单栏会收到Midjourney bot 发送的私信消息,打开就可以看到该图片的Seed值,复制这个种子值,在下一次的描述词里面加入 --seed 数值,就可以看到生成出一样的图片。
有了 seed 值,我们其实就可以反向利用这个特性,来对已经确定的效果图进行微调了。
举个例子:
修改关键词把「rabbit ears hat」改成「 cat ears hat 」,并且在最后加上 --seed 1668584462
描述词:Blind box style, Cute little girl with cat ears hat, Full body, Look at the camera, Pop mart, octane rendering, ultra details, edgelighting, chibi, The best quality, HD, C4D, chiaroscuro, 8K
利用相同的seed值,调整关键词,换上不同的帽子,得到以下结果。虽然还是有一定的随机性,但角色的一致性还是控制的很好。
更多控制角色一致性可以看我之前的文章《Midjourney零基础设计角色一致性》。
Remix 模式下,你可以在每次变化中修改你的提示词,并基于原图进行新的关键词优化。所以,Remix模式就能帮我们在设计中控制画面一致性,改变你希望改变的地方,比如图片的局部的颜色、背景、主题或构图。比 seed 值和垫图更加可控!
方式一:输入 /prefer remix 命令来打开或关闭合成模式,当 midjourney bot 提示你“Remix mode turned on”,就表示 remix 模式开启成功。
方式二:发送 /setting 命令到达设置面板,然后点击 「remix mode」按钮变成绿色混合模式开启。
当Remix处于开启状态时,点击V按钮,会变成绿色,通过修改弹出窗口中的提示词来基于原图片进行创作。
举个例子:
生成一张图“line-art stack of pumpkins”将关键词改为“line-art stack of pumpkins --test” 、“balloon-animal shaped stack of pumpkins"、“vibrant illustrated stack of fruit”,最后得到一副水果南瓜造型。
再举个例子:
生成一张月神女孩,点击 V 更改提示词“yellow”改变整个画面的颜色,得到一张暖光黄色衣服的月神小姐姐!
更多基础知识和参数可以看我之前的文章《Midjourney从零基础到落地实践》。
你是不是也遇到过,明明想要一个白色的兔耳朵偏偏给我红色的兔耳朵,在尝试了修改权重后还是无果。
你是不是也遇到过,终于经过28次刷新发送生成了一张老板满意的图片,老板突然说能不能把这个沙发换个颜色?
恭喜你,这个时候不用打开PS,直接继续midjourney冲吧!
因为上周二 8月22日凌晨 02:25,Midjourney官方正式上线了新功能 局部重绘 Vary Region,相信对于关注AI绘画的朋友们一定不陌生,在stable diffusion早有局部重绘的功能,且好用极了。
意思是小伙伴们今后可以在Midjourney中轻松地对生成后的图片局部进行修改、新增、删除,两个字真的太香了!
以下是官方的更新的公告和ChatGPT的翻译:
Vary Region 功能支持 v5 / v5.1/ v5.2 和 niji 5 这 4 个版本。Vary Region 和之前的 zoom out 和 pan 功能一样,是针对单张图片的操作。
第一步骤:
Blind box style, Cute little girl with rabbit ears hat, Full body, Look at the camera, Pop mart, octane rendering, ultra details, edgelighting, chibi, The best quality, HD, C4D, chiaroscuro, 8K --s 400
我们需要先使用 prompt 提示词生成四宫格图片后,选择一张喜欢的放大,才能看到对应的选项,Vary Region 按钮位置就在第一行。接下来,我想要修改她的帽子。
第二步骤:
会出现一个「局部重绘界面」,让我们来看看这个界面的功能介绍吧。
(1)选择工具:有两种选择工具,框选区域、套索自由选中(类似PS)
(2)选中区域:在图片上选中需要修改的区域
(3)输入文字:在输入框中输入修改的 prompt 提示词:「rabbit ears hat 」
(4)确定按钮:点击确定,等待生成图片
二次修改,继续重复操作或者调整。
对比效果真的是神奇魔法,指哪打哪,太好用啦!
可以看到,我的测试结果,使用两种不同选择眼睛的区域,修改提示词同样是“glasses”
框选区域的不同,造成一种生成了眼镜,一种只是眼睛瞳孔颜色的形状的微小变化。
第一组我用套索工具精准的勾勒出眼睛的轮廓,但生成的图像中并没有出现眼镜元素;
第二组则是直接用矩形选框工具选择了整个眼睛,生成的图像中正确出现了眼镜。由此可见如果框选区域过小,的确不利于 Midjourney 正确地生成新的内容。
官方也给出解释:
① 此功能在图像的大区域(图像的20%到50%)上效果最好;(大区域绘制效果好)
② 这不是一个神奇的解决方案,通常最好是做一个变化(微妙), (就是说这个功能不咋地,不要有太多的期待) 官方在发布这个新功能时,明确提到框选区域的大小会直接影响图像生成的结果。宽松的选取区域会给 midjourney 提供更多的参考信息,以及更多空间来生成新的创意和细节;精准的选取范围则会带来更小更细微的变化,但也可能会导致生成的内容与周围不太契合。官方建议在图像总面积的 20% 至 50% 的范围内使用 Vary Region,生成的效果会最好
(1)电商换装
model wearing the monogram print coat, shorts and a bag, in the style of jacob hashimoto, white and red, women designers, dark red and light blue, intensely personal, high resolution, high quality --ar 1:2 --s 750
(2)创意广告
an animated air balloon filled with strawberries and grapes, in the style of dreamlike surrealism, photographically detailed portraitures, rococo realms, surrealism-inspired, airbrush art, children's book illustrations, light red and sky-blue --s 750 --ar 16:9
(3)动漫场景
Goddess of the moon and beauty,Japanese comics/manga,Castle in the Sky --s 750 --niji 5
(4)运营海报
two Girls of sunshine trend, Blind box style, pop mart, playful character design,Maldives, Swimming pool, hyper-realistic water, uhd image, octane render, C4D, 8K
(5)室内设计
a living room with a blue chair by giorgio lanzamagno, pictured alongside blue steps, in the style of light gold and light beige, suspended/hanging, mediterranean-inspired, lee broom, richard meier, neo-concrete, spot metering --ar 14:19 --s 750