服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

一些 Midjourney 的入门指南与绘画经验

日期: 来源:刘言飞语收集编辑:刘飞


以下是我体验一个多月整理的观察、经验,以及较具体的入门指引。


——

1. Midjourney 会让一些插画师失业

自从 Midjourney 的 v4 版本在 2022 年 11 月 5 日发布之后,我就上瘾了。

Midjourney 画出的图片,惊艳程度是超越了「可用」的范畴的,让很多人认为,只会简单绘图的插画师将会失业了。

像这个,就是我帮朋友月莞柔的在 2022 年广受好评的新播客《大食话》画的插画风格海报,Midjourney 出片,仅需 3 分钟。

更多观察和思考,可以参考这一篇:沉迷 AIGC 两周后:某些人失业是必然的

还可以参考播客「三五环」的这一期播客:

2. prompts 就是 AI 绘图的核心竞争力

这就说到,AIGC 目前还是需要有很经验主义的引导语,在 Midjourney 工具里被称为 Prompt。Prompt 的使用方式直接影响了图片的质量效果。现在 Midjourney 还没有大家想象的已经到了随意说点啥都能画得特别令人满意的程度,很多时候好的图片是需要调教的。

例如,我曾经想画一个封面,表达的是喝运动饮料的运动员的状态,用的 prompt 是:

A asian athlete, throwing out drink cans, pop art, circle picture

(亚洲运动员,扔出饮料罐,波普艺术,圆形)

有点不符预期,这几个过于写实了,也不咋好看。似乎固定一下风格会好一些。怎么让运动感更强,而且更有艺术性呢?

于是我加了一个「colorful ink painting」,水墨画风格。就变成了这样:

比刚才的更风格化了、更有趣了。

只要使用一段时间 Midjourney,就会发现,对于风格的描述,几乎是写 prompt 最重要的技能。

我曾经想要模仿画一幅类似艺术家徐冰的作品《天书》的作品,他用常见的部首组合成不存在的字,这种陌生又熟悉的感觉很有意思:

由于 AI 目前是完全不识字的,画出来不存在的字这个好解决。但怎么样让文字整齐排列,像是一幅书法作品呢?

如果直接输入

Chinese words, Calligraphy

(中国字,书法),会出现这种结果:

当然也挺好看,但不符合预期。

这时我想到了前阵子用过的一位摄影师的风格,他叫做 Andreas Gursky,1955 年出生的德国摄影师,喜欢大尺幅、高密度的拍摄手法,比如这样的:

(巴黎蒙帕纳斯线 Paris Montparnasse ,1993年)

那不是巧了吗?于是用简单的这个 prompt :

Chinese words, Calligraphy , by Andreas Gursky

就能得到这样的结果了:


所以接下来就容易说明了:

对于 Midjourney 的使用来说,promps 就是核心竞争力。

这些各种各样的风格,包括画风(水墨、波普、抽象)、艺术家(摄影师、画家)等等,是能画好图最关键的武器。创意当然重要,但离怎么样实现创意之间,需要有大量的 prompts 的素材作为武器。

3. Midjourney 保姆注册和使用说明

想尝试的朋友,这里提供一份完整的注册使用说明。

1)科学上网。

2)注册网站(www.midjourney.com),注意,由于 Midjourney 并没有自己官方的客户端,而是搭载在 Discord 上的,所以过程中,没有 Discord 账号的话也要注册一下。

3)Discord 可以简单理解为微信群,Midjourney 在群组里放置了机器人(bot)。我们画图的过程,就是把 prompt 发给 bot,它会回复给我们。

所以加入大的群组(社区)后,可以看到各种小群组。对于新用户,有免费的画图名额,要进入新人画图群组,是这几个 newcomer rooms:

进入之后,你会发现很多人已经在画图了:

画图的方式是,在对话框里输入

/imagine

对话框会变成这样:

在 prompt 的框里输入英文的描述,敲回车即可。

4)你会发现每次生成 4 个不同的图片,这样每张都不算高清。这其实算是 demo,低成本地让你判断有没有合适的,然后可以再做 upscale (升级,或者扩大篇幅)的操作。每个图片下面也有快捷按钮,U1-U4 指的就是按顺序的图片。

注意,upscale 的操作也是耗费额度的。

具体 upscale 的操作技巧,下一节我们再聊。

5)免费会员有 25 次的使用额度,用完后就没了。付费会员则分为几类:

- 10 美元/月,每个月 200 张的额度;

- 30 美元/月,fast 模式大概有 900 张的额度,relax 模式额度不限;

- 60 美元/月,fast 模式大概有 1800 张额度,relax 模式额度不限,同时可以私密模式下使用(其它模式下你画的图是公开在个人主页的)。

一般推荐的还是前两种。付费可以用国际货币信用卡。

查看付费页面的方式是在输入框里使用语句:

/subscribe

付费会员会有自己的 bot,不用在群组里发了:

几个补充:

  • fast 模式和 relax 模式顾名思义,就是速度不同,fast 基本会确保 3-4 分钟出图;relax 不一定,但个人体验下来也还好,很少有超过 10 分钟的,因为是排队的模式,在有时差、外国人都睡觉的时段,速度也很快。
    切换 fast 和 relax 的方式是直接在输入框里输入语句:
    • /fast
    • /relax
  • 英语不熟悉的朋友,推荐用这个:deepl.com
  • 用 Midjourney 画出的图片,创作者可以拥有版权,这两种情况例外:
    • 是免费会员;
    • 用于年收入超过 100w 美元公司的使用。
  • 更详细的可参考:docs.midjourney.com
  • 对于付费会员来说,Midjourney 的 feed 社区是发掘好的 prompts 的绝佳圣地:www.midjourney.com

4. prompt 结构说明与属性描述词
Midjourney 的 prompt 的结构可以拆分成三个基础组成部分:
1)内容描述:就是主体内容,表达我们到底想画什么。是骡子是马,是猴子是兔。他们是什么形象、穿着什么衣服、在干什么,等等。
2)风格描述:包括曾经讲过的艺术家、画笔风格、艺术风格等等,甚至包括打光、视角、拍照相机的牌子等等。
3)属性描述:最基本的图片属性,比如尺寸、使用的 Midjourney 版本。
显然,内容描述是各位在画每个图的时候各自去创作的;风格描述,就是这个创意库接下来要探讨的;而属性描述,是相对最基础也容易掌握的部分。这篇文章就探讨几个最基本的属性描述词。
对了,强调一下,内容描述和风格描述都是可以用 , 或者 + 隔开的。而属性描述是要用两个短横线隔开的,要严格遵循:--[属性名][空格][属性值]
比如:rabbit, white --v 4

版本号 --v 1/2/3/4
前文提到过了,去年底发布的 v4 是效果最震撼的,而之前的三个版本还没有达到如此写实的程度。2023 年,这个专栏更新的过程中,Midjourney 预计会发布 v5,又会有一轮优化。
v 1-4 的区别,可以用同样的关键词来体会,比如:
cat --v 1

cat --v2
cat --v3
cat --v4
直观的感受,自然是默认都用 v4 即可,效果是最好的。但在画不同艺术风格的图片时,也未必。有时候觉得过于写实了,用一下 v2、v3 画抽象的风格,可能会有奇效
另外,每次输入 --v 4 是比较麻烦的,想要默认都是 v4,可以输入语句:
/settings
这里面可以选择各种默认的语句。每次输入完,会自动给你添加上的。
扩幅相关 upscale
upscale 是把 4 in 1 的 demo 图片扩大篇幅成为更高清的图片。默认的扩幅一般就能用了。
这里还有一个 Make Variations,也容易理解,就是根据这个图重新做一份 4 in 1 的 demo,效果是这样的:
对于扩幅的图片像素大小,官方有一个完整的图表:

负面提示词 --no
如果不希望图片里出现什么内容,可以用这个描述。
比如:
--no hands

不要出现手。

质量 --q .25/.5/1/2
这是很量化的图片渲染时间,默认是 1。如果用更短的时间,消耗的额度更少,图片效果可能略差;反之亦然。
注意,渲染时间也跟额度有关。q 设置为 2,差不多就消耗两倍的额度。

图片比例 --ar 2:3/3:2
v4 版本只支持三种比例:
默认的 1:1,2:3 和 3:2(今天刚更新的版本,已经支持 16:9 等尺寸了)
要调整比例,使用语句 --ar,如:
cat --ar 2:3
v3 支持更多比例。但这里不展开说了。

参考图片
Midjourney 是支持参考图片的。比如如果想依据自己的照片画图,可以直接把图片网址放在 prompt 里面。例如:
https://s.mj.run/euG_Zu_BnQM iron man
如果图片还没有上传到什么图床,可以直接在对话框里发送,发送完后点击右键——复制地址。

增加语句重制 Remix
跟普通的重新制图不一样,高阶版的增加语句重制,可以在原构图/基本结构上,画别的主题。
具体操作是要去 settings 里打开 Remix Mode,然后再已经 upscale 的图片下点击 Make Variations,就可以另行输入 prompt 了。
这是我画的中国古镇:
这是用同一张图片在 Remix 模式下绘制的北欧古镇:

更多相关的属性描述词
可以参考官方手册:docs.midjourney.com

掌握了以上这些,可以说已经完全可以入门、画出一些不错的画作了。

5. 我的 Midjourney 创意库
正如前文所说,prompts 是 AI 绘图的核心竞争力(就目前而言)。我之前有各式各样的尝试,慢慢地把各式各样的几百条描述词沉淀成了自己的 AIGC 资产。这些分享给你,想必你也可以成为一个专业的 AI 画手。
以下是这些创意的实例:



如果你对怎么画出这些图比较感兴趣,欢迎来小报童订阅这个年度专栏。如果你很喜欢它们,想要当做壁纸,这也是个不错的壁纸库。
权益说明如下:
  • 我会每篇提供同一个主题的图片,在 5-10 张左右;
  • 专栏更新周期大概是一年,不少于 50 篇,因此图片大概在 300-500 张之间;
  • 配合主题,我会介绍风格、艺术家和在 Midjourney 中的使用实例(prompts);
  • 提供高清的图片,并放弃版权,可以非商用前提下随意使用;
  • 加入读者专属的微信群,讨论 Midjourney 的使用,和 AIGC 的动向。

目前是优惠阶段,在 1000 个读者之后,会恢复原价。

相关阅读

  • 风格切换进行时?

  • 核心观点核心观点:市场表现:年后市场整体乐观,呈现普涨格局,A股小盘风格领涨。本周(1.30-2.03)全球主要股指均呈现上涨,其中台湾加权指数、纳斯达克、印度SENSEX领涨。风格上看,A股
  • 不知不觉他已经是中小盘成长风格中业绩最强的了

  • 短期一两年来看,投资风格很重要,如果符合市场,可以带来很强的beta收益;中长期三五年来看,投资风格又没那么重要,只要坚守风格,市场总会来到适合你的阶段;再拉长到七八年去看,投资风格
  • 明星经理密集卸任,该用什么基金替代?

  • 春节过后,又双叒叕好多基金经理离职或卸任基金。泓德·邬传雁、信达澳亚·冯明远、诺安·蔡嵩松、诺安·蔡宇滨、中加·冯汉杰、长城·何以广、恒越·高楠.....很多人觉得指
  • 穿越短期 获得令自己满意的收益

  • “生活实苦,人生艰难。”朋友向我抱怨说。不知何时起,我们看别人顺风顺水、想自己磕磕绊绊;慕别人风光无限、挑自己烦忧各半。殊不知,你有你的苦,他有他的烦,我有我的累。“每年都
  • ControlNet VS GEN-1 :谁将成为AIGC的新范式?

  • 今天早上在网上看到了一张梗图,忽然想起来半个月前申请了 runway 的AI新视频生成工具的内测,这个视频工具叫 GEN-1,在 ControlNet 发布前大家都对它期待很高,但是 ControlNet 出
  • 查分时间更新!最迟23号

  • 本文由考研斯基原创,转载须注明来源出处本文约1250字,预计需要4分钟大家好,我是考研斯基。距离考研初试成绩公布还有6天左右的时间了,部分同学是不是感到有些焦虑?不要着急,学长当
  • 4所学校出分!今年阅卷很宽松!

  • 本文由考研斯基原创,未经授权禁止转载本文约1300字,预计需要4分钟大家好,我是考研斯基。马上出分了,相信同学们都在焦急地等待,学长当年也是这样的,但是每年都有学校“抢跑”。今
  • 你真的会用【Ctrl+C】【Ctrl+V】吗?

  • 公众号又改版了,赶紧星标置顶【秋叶 PPT】!不然你就收不到我们的干货文章啦!作者:晓阳 PPT 制作编辑:小叮 PPT 制作在办公领域,有这么一类人,人们戏谑地将其称之为「CV 工程师」,乍

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 一些 Midjourney 的入门指南与绘画经验

  • 以下是我体验一个多月整理的观察、经验,以及较具体的入门指引。——1. Midjourney 会让一些插画师失业自从 Midjourney 的 v4 版本在 2022 年 11 月 5 日发布之后,我就上瘾了
  • 一份二十年下来总结的流量获取方法论

  • 本文作者国平,首发“光年实验室”,经授权全文转载。作者国平之前在阿里巴巴做过多年流量增长的业务,对互联网发展这么多年以来的流量获取有很多洞察和思考。这篇文章是我看过对
  • 飞书真的会存在「体验优势」吗?

  • 1在企业工具方面,体验本不是第一性的。做体验的产品经理可能会失望,但产品经理原本也该围绕第一性去做产品。企业办公领域,如何真正提高工作效率,如何真正管理组织,是决策者首要
  • 从 ChatGPT 看 AI 未来的 7 种场景可能性

  • 写在前面ChatGPT 自去年 11 月 30 日发布后,开始在科技圈里引起热议。到了如今 2 月份,已经变成(科技领域)全民狂欢,有个说法是,Web3 的开发者大都掉头去搞 AI 了;大厂纷纷入局,紧张
  • 送你

  • 有知有行今年的红包封面,我很喜欢,请收下,预祝新春愉快。我自己做的从周末到现在还没有审核通过,回头大家去星球取用吧,感谢。1每年这个时候,我都会回顾一下微信红包的故事,就像去
  • 放松

  • 题图:松驰 | 摄影:冰清1分享一个近期心得体会。去年底以来的双十一、双十二和不久前的年货节里,我基本上消极随缘参与,买的东西很少,也完全不去追求复杂活动逻辑下的优惠最优解(事