服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

逼真到颤抖!Midjourney画出完美中国情侣,画师、演员、模特一键淘汰

日期: 来源:新智元收集编辑:新智元



  新智元报道  

编辑:编辑部
【新智元导读】继GPT-4之后,Midjourney V5上线。网友纷纷试玩,画出了一对中国情侣,视觉炸裂,碾压人类画师。

昨天,由Midjourney V5画的一对中国情侣在网上引起轩然大波。
许多人纷纷惊呼:人类画师别活了。
有人不相信这是Midjourney之作,也亲手体验了一把。在输入以下的promot后,画风瞬间惊艳了。
「A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen --v 5 --s 250 --q 2」
在GPT-4发布后,Midjourney也更新了V5,不仅绘图更逼真,而且prompt更灵敏。
最重要的是,一直被诟病的「AI 不会画手指」,Midjourney V5都拿捏了。
还有满屏的电影质感,除了OMG,还是OMG。
甚至有网友惊呼:模特不存在了!

效果炸裂,一大波设计师要失业了

从Midjourney的V1到V5,就可以看到AIGC这一年来的进化速度有多快。
最新V5版的图像质量更高、输出更多样化、有更广泛的风格、支持无缝纹理、有更宽的纵横比、有更好的图像提示,以及更宽的动态范围……
激动的心,颤抖的手,国内网友纷纷上手实操了一波。
先上手的写真图:
虽然V5能够画出5根手指,但是在手指的细节上,还是差点意思。
比如试着让Midjourney V5给梵高的房间拍个照:
Midjourney V5在画中国美女的神态时,把控也是非常到位。
V5还能拿捏中国古典风格的美,画出了亭亭玉立的美人,细节颗粒度拉满。
还有网友用GPT-4+Midjourney V5创作了电影「杭州重生」,连豆瓣上介绍页都P出来了,看起来还真是那么回事儿。
在2022年12月,谭木匠举办了一场梳子比赛,人类设计师设计的梳子如下:
网友黄仲生用V5试了一波,并惊讶地发现「麻瓜」在AI面前完全不能打。
当别人反馈说上面的梳子太美,只能用来收藏,网友又整了一波日常可用的梳子。
还有给小朋友用的梳子
在国外,有网友直接用Midjourney V5画出了The Matrix的电影质感,让人瞬间怀疑这是不是电影里的截图。
并且献上了prompt:
「Keanu Reeves in The Matrix. AI cinema. Synthography. Cinematic. Film grain. --ar 16:9 --v 5」
还有网友尝试用「民宅火灾现场微笑女孩」经典meme让Midjourney创作「城堡火灾现场微笑洛基」。
来看下这炸裂的效果。
网友还开脑洞把「北京屋顶情侣」图加上洛基元素。
还有个搞笑版的,龙卷风来了,老太太骑着电驴在「狂飙」。
亚洲人的脸部特征也是做的非常逼真。
旅行博主都不用出门,直接在家调教Midjourney就可以了。
还有网友拿V4和V5做了对比图,通过输入一张图,还有文字提示,V4生成的图片在光照下物体阴影处理方面无法与V5相比。
再来一张眼睛特写图:
通过对V3、V4、V5这三个版本输入相同提示、相同设置,对其输出图片进行了对比。
在V5这个版本中,波光粼粼的水面,还有鱼儿在水中游的倒影,已经达到了以假乱真的程度。
但是如果没有提供有关环境的文本的提示,比起V4,V5默认生成了更加真的环境。
网友迫不及待地让V5来复刻一下王家卫「蓝莓之夜」的电影风格,发现V5在处理玻璃的反射方面做得更逼真了。
以及各种真假难辨的作品:
反派气质拉满的马斯克:
「猫戴VR」:

比V4强在哪?

最新升级的V5,相较于前一版有什么改进,一位研究员就他们之间的对比做了一张表:
1. 密铺(--tile argument)
在创建模式时使用。此前V3有这一参数,然而在V4中暂时终止使用,V5版本重新上线。
比如输入「/imagine tesseract pattern, repeat, white and blue highlights --s 1000 --v 5 --tile」,生成如下的图:
2. 长宽比(--ar argument )
在V4中,只能有不高于1:2或不宽于2:1的自定义纵横比。而在V5中,你可以自定义比率与任何「宽度: 长度」比,如下是自定义比例的演示:
这一点升级,意味着什么?
现代电影中常见的最宽纵横比2.39:1都能够实现,你可以制作电影巨幕,人人都能成为导演!

V5生成2.4:1电影画幕
3. 图像权重可以自定义( -- iw argument)
图像提示中的权重现在可以输入自定义值。你可以决定输入图像对最终生成的图像的影响程度。
如下,在Midjourney V5中,输入一张图和一句文本提示。
通过自定义不同权重,2、1、0.5生成了不同的图片。
输入的提示如下:「/imagine http://imgur.com/romman.png a roman soldier with daisies in the background --seed 123 --iw 2 --v 5」

4. less opinionated

「less opinionated」意味着,在V4中,只需要编写较少的文本提示,Midjourney便会输出更具创造性的图像。
但V5不是这样的,你可能需要输入更多的形容词,并给出更多的细节,比如风格或情绪,输出图像应该是什么样子。如果没有更多描述,Midjourney就会输出一个默认风格,比如「摄影」风格。
这一点升级,可以让人们通过文本提示能够更精准地把控Midjourney输出的内容。也意味着,在输入文本和输出图像之间有「更多的内聚力」。
以上4点升级是官方博客中提到,但是最让人意想不到的是Midjourney V5能够画出「5个手指和脚趾」!
另外,V5已经在更真实的图像/照片上进行了微调,因此可以看到在输出窗户反射和透过玻璃的图片上更加真实。

考考眼力见

最后来一个测试题:
下面4张图,只有一张是真人,其他都是Midjourney V5画的,猜猜真人是哪一张?

参考资料:
https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295
https://twitter.com/mranti/status/1637326003927396352?s=46&t=iBppoR0Tk6jtBDcof0HHgg





相关阅读

  • 图像处理技术在农业遥感无人机中的应用

  • 本文收录于《农业信息化》2022年第11期,目次01摘要:随着无人机技术的发展和成熟,该技术应用越来越广泛。中国农业正在由传统农业逐渐转变为信息农业、智慧农业、精准农业,农业遥
  • Chem. Sci.:三组分合成含碘阳离子COF

  • 一种用于增强放射治疗的含碘共价有机框架DOI:10.1039/d3sc00251a(图片来源:Chemical Science) 无金属放射性增敏剂,特别是碘,由于其合适的X射线吸收能力和可忽略的生物毒
  • 广州地铁女子打人被刑拘,现场视频曝光!

  • 3月16日,广州公交警方通报,3月15日21时30分许,王某(女,50岁)在广州地铁4号线大学城北至新造站列车车厢内与李某(男,31岁)因座位问题发生争执,并对李某进行辱骂殴打。民警到场后发现王
  • 开源 7 天,斩获 2.2 万 Star

  • 出品 | OSC开源社区(ID:oschina2013)除了大力投资 Open AI ,微软还亲自下场大搞 AI 。8 天前,微软开源了 Visual ChatGPT ,这个软件可以连接 ChatGPT 和一系列视觉模型,以实现在 C
  • 富豪出价10万美元,要求邻座女士摘口罩?

  • 近日,美国一位亿万富豪在飞机头等舱里,开价向邻座女乘客提出一个要求,让他本人陷入了巨大的争议之中。原来他在乘坐达美航空一架航班时,对邻座一位女士表示,愿意出100美元让她摘
  • 20万请曹姓明星带货,3个月仅成交278元

  • “明星的尽头都是直播带货”明星直播带货相比于素人主播有着天然的流量加持成为很多电商产品的选择3月16日南宁市西乡塘区人民法院通报一起“明星带货案件”引发网友热议⬇️2

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 赵伟国被审查起诉!

  • 日前,国家监委对紫光集团有限公司原董事长赵伟国涉嫌职务犯罪问题进行了立案调查。经查,赵伟国身为国有企业管理人员,利欲熏心,肆意妄为,背弃职责使命,公器私用、化公为私,将所管理
  • 回见武林,相约之江!

  • 陪伴市民14年的浙江省博物馆武林馆区,即将正式闭馆,省博的“武林时代”即将结束,也意味着浙博的历史即将载入“之江时代”。浙江省博物馆武林馆区近日,杭州市文广旅游发布消息:省