服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

视频版Midjourney又进化了:一句话生成视频

日期: 来源:品玩收集编辑:品玩

提到国外的生成式AI大模型,文本生成领域有ChatGPT,图像生成领域有Midjourney和Stable Diffusion,那么视频生成领域有什么?

很多人第一个会想到Runway公司的Gen-1。

Gen-1是Runway在今年2月推出的一款(也是该公司的第一款)由文本生成视频的AI大模型。不过就在几天前,它的迭代版本Gen-2也正式发布了。

在此之前,Gen-2从3月下旬开始已经进行了一段时间的小范围测试。

虽然当时Runway的发言人Kelsey Rondenet说过Gen-2会在未来几周对所有人开放,不过直到6月,这个承诺才算真的兑现了。

所以千呼万唤始出来的Gen-2,到底进化到哪一步了?

真正的从零开始生成视频

在发布Gen-1的时候,Runway专门开辟了一个网页来给大家讲解Gen-1能怎么用,大致来讲主要包括了下面5个功能:

-输入一张图片提示,来让原视频变成你想要的风格;

-上传视频+一段提示词,生成你想要的视频(比如让一只拉布拉多变成斑点狗);

-输入图片或提示词,来让一段只做了3D建模的视频草稿变完整;

-上传一段随意拍摄的视频,自动生成一段有故事感的片段(比如随意摆放的书最后成了一片高楼大厦);

-在原视频的基础上,更自由地定制你想要的视频风格(哪怕变出一只现实里并不存在的奇行种)。

发现没有,使用Gen-1的前提是必须先有一个现成的视频。说白了,Gen-1的作用其实就相当于给原视频加了一个更高级的滤镜

而到了Gen-2,可以说才真正实现了从零开始生成视频的梦想。

从介绍来看,Gen-2比Gen-1多了3个厉害的功能:

-文本到视频:只用输入一段提示词,就能生成一段视频;

-文本和图片到视频:输入一张图片+一段提示词,就能让图片动起来;

-图片到视频:只用输入一张图片,就能自动生成一段视频(比如让图片里的云飘起来,水流起来,人走动起来)。
此图为输入“The late afternoon sun peeking through the window of a New York City loft”的提示词生成

如果说Gen-1充其量只能当做一个修改视频的工具,那么Gen-2几乎已经能作为一个视频生产工具了——试想一句话生成的一个个视频片段,最后拼到一起就能讲一个完整的故事了……

总之就是只能拿来玩和能拿来用的区别。

虽然目前Gen-2生成的视频依然存在细节模糊不清、形态扭曲等等品质问题,且生成的视频长度最多只有4秒,但它可能是现在视频生成领域最厉害的AI大模型工具了。

当然,从Gen-2开始,也标志着Runway公司正式进入了收费时代:不同于Gen-1的完全免费,Gen-2免费版的视频生成功能有限(试用额度只有105秒,约等于26个4秒视频,且分辨率低、有水印),用户需要每月付15美元(或144美元包年)才能用到它的完整功能。

Runway有啥来头?

Gen-2背后的Runway是一家成立于2018年的年轻公司,一直在研究怎么用AI来提升视频制作效率。

除了TikTok和YouTube上的普通用户,Runway的客户还包括了不少主流影视工作室,比如扣扣熊主持的《深夜秀》就用到过Runway的工具来辅助编辑图像。

它最著名的一次应用应该是去年在中国观众中间非常出圈的电影《瞬息全宇宙》,据报道里面让人印象深刻的面条手,还有石头对话等超现实场景都用到了Runway的技术。

不过很多人可能会忽略的是,早些天被爆出大丑闻的Stable Diffusion也和Runway关系密切。

准确来说是一直被外界视作Stable Diffusion(时下图像生成领域最热门的大模型之一)背后公司的Stability AI爆雷了,媒体列出Stability AI的罪状之一就是,它把Stable Diffusion的10亿代码成果“据为己有”,而它充其量只是给Stable Diffusion提供了算力(出了钱)。

实际上真正为Stable Diffusion出力的是慕尼黑大学、海德堡大学,以及Runway。

Stable Diffusion最早发表在CVPR 2022年中的一篇论文

也就是说,Runway是Stable Diffusion的研发者之一。

Runway在去年还因为官宣发布了Stable Diffusion v1.5版本一度被Stability AI抓着不放,但那次的舆论最终还是站在了Runway这边。

这也是Runway在“成名”以前为数不多的“八卦”。

后来就像大多数的大模型开发公司一样,不再参与Stable Diffusion项目的Runway在发布Gen-1之后,发展速度就像坐上了火箭,并且在本月初拿到了谷歌的投资,距离D轮1亿美元的融资刚过去一个月,累计融资至少已有2亿美元,成为大模型领域的明星公司。

说个更直观的数字,2021年12月对冲基金Coatue花3500万美元投资Runway时,其估值为2亿美元,一年后估值变成5亿美元,再过了半年,它的估值就又翻了3倍(保守说有15亿美元)。

网友:好莱坞is dead

Gen-2的正式发布让不少网友感到兴奋。

在Runway官宣发布Gen-2的推文下,出现了一些普通用户“求教程”的声音:

不过已经有行动力强的用户开始试着用Gen-2生成自己的视频了,不少用户都在Runway推文的评论区交上了自己的4秒钟“作业”。

尽管Runway只是在网站列出了Gen-2的主要功能,并没有教给大家更多Gen-2的玩法,但聪明的网友已经自己学着用Gen-2生成的视频剪辑出了一个有反转的短故事。

比如这个叫“Monster of the sea(海怪)”的48秒故事:天气晴朗、风平浪静的一天,一搜帆船开始还很悠然地行驶在海上,船上的游客惬意地碰着杯喝着酒,可突然狂风大作,船员拿起望远镜往远处望,发现一只巨大的海怪出现在海面,船随着海浪开始颠簸,甚至燃烧了起来,船上的人纷纷跳水弃船逃生。

来自推特网友@MHU

甚至有直接用ChatGPT写了剧本、再用Gen-2生成的视频拼成一个故事的。

还有用户拿Gen-2生成的素材剪了一个1分钟的电影预告片,甚至在最后幽默地加了一个戛纳电影节的标志,如果生成的视频质量再高一点,怕不是真能以假乱真。

来自推特网友@Toni Seldr

不过视频质量差、生成的视频时长太短等也确实成了用户吐槽Gen-2的点。

并且在为安卓用户提供App服务的问题上,Gen-2和Gen-1一样也还是没有长进。

当然,更多用户还是对Runway表现出了宽容。有网友评价说,“虽然它有太多的不完美,但有一点可以肯定,整个视听工业都将迎来革命性的改变。”

还有网友更激进地说,“好莱坞已死,任何人都可能做出一部世界级的电影。”

真能取代好莱坞吗?

可以理解为什么广大网友对Gen-2的推出如此兴奋。Gen-2对普通用户的好处是明摆着的——假以时日,文本生成视频技术一旦成熟,将意味着拍电影不再只是大制片厂的专属,任何一个普通人都可以做一部自己的电影。

Runway并没有明确说过Gen-2面向的人群到底是谁。不过我们可以从它推出App以及之前和影视工作室有过的合作等等动作来看,大致猜到有哪些人会用到Gen-2:专业的制片公司,个人工作室性质的独立生产者,以及我们这样的普通用户。

虽然Gen-2看起来对普通用户很友好,但制片公司们会用Gen-2这样的工具也是肯定的。

毕竟大模型不同于过去任何一个热过之后就销声匿迹的概念,它将成为未来又一次深刻改变人类的产业革命,几乎已经是各行各业的共识。

事实上在国内,已经有影视项目开始借助大模型来完成一些工作。比如在剧本筹备阶段,会把分镜头故事板的产出工作交给Midjourney(据说能省下几十万元的成本)。

那假设,有一天Gen-N成熟到也能生成能直接拿去用的完美镜头呢?

或者可以拿大模型在游戏行业的应用做个类比,Midjourney等工具的使用显然已经对游戏公司产生了非常现实的影响:先是出于节省成本的需要砍掉美术外包团队,接着就是在自己人身上动刀,甚至有从业者提到最多有8成的原画师会下岗。

考虑到如今大模型的迭代速度,它的影响真正显现在影视行业也会是迟早的事。

不过我反而觉得,Gen-2大模型可能会淘汰那些影视行业流水线上的“工人”,但却淘汰不了真正的艺术家。

之前听到过一个说法,AI大模型生成的内容里,可能有80%都会是对人类过去经验无聊的重复,但也可能有20%闪光的东西。就比如在中式美学和赛博朋克如何进行融合的问题上,普通创作者可能需要极长时间进行思考,AI却可能生成一个让人意想不到的结果,给人带来惊喜。

这20%是AI存在的意义,剩下的就需要真正有创造力的人去补足。

还有从业者提到过一个观点,AI大模型运用到影视行业的生产,不意味着非专业人士也能轻松上手——如果想借助AI的力量创作剧本,还需要针对剧本公式和故事结构等相关知识进行充电。不具备基础知识的小白即便有了AI这个超级助理也无济于事。

所以回到AI是不是能取代好莱坞的问题,事实上好莱坞可能是最早对新技术的“入侵”有所感知的,就像在今年5月初,数以千计的好莱坞编剧工会(WGA)成员曾进行罢工示威,诉求之一便是抵制在剧本写作中广泛使用AI的现象。

如果有一天Gen-N真的来了,好莱坞导演们可能第一个不答应。


相关阅读

  • 加快发展新一代人工智能

  • 理解提问,快速给出回答;训练声音,翻唱经典歌曲;根据描述,绘出趣味画作……近期,基于大模型研发的生成式人工智能,展示了在语言理解和内容生成等方面的出色能力,引发社会关注。  
  • 营造人工智能大模型产业生态

  • 推动人工智能大模型产业化应用是提升国家竞争力的关键举措。要抢占人工智能大模型产业发展制高点,必须加强战略规划和深度治理,推进新型算力生态基础设施建设,打造稳定可靠的算
  • 微信发公告:这类行为,严厉打击

  • 为维护视频号的绿色直播环境,营造良好的直播生态,持续优化直播体验,保障用户的合法权益,微信视频号坚决反对并持续打击以博眼球、斗狠为噱头的不良PK行为(如:自残自虐、引人不适等
  • 视频号电商,618最低调的玩家

  • 出品|派财经文|玛利亚 编|派公子一直不温不火的视频号,今年再次参加了618。今年618各家电商平台纷纷卷向了低价战,但视频号则悄然无声,只是按照惯例在流量侧给予了一定补贴政策。
  • 国内最小的大模型创业团队,靠另类创新出位

  • 导语:拥有多年NLP经验的虎博科技,凭借自身独特的技术创新,打破“成本魔咒”,重新定义“短小精悍”。国内大模型创业迎来了新面孔。包含70亿参数和1800亿参数两个版本的大模型Tig
  • “AI城管”上岗 一车更比四人强

  • 在智能视频采集车内,可通过采集设备观测所采集的外界问题。罗展 摄星沙时报讯(记者 罗展)6月15日下午,一辆搭载智能视频摄像头、北斗定位仪以及车载智能平台系统的智能视频采集
  • 大模型赋能,生成式AI引发新一轮智能化浪潮

  • 近期人工智能板块的催化信息层出不穷。昨日AI短暂休整,今日再度走强,其中数据要素、CPO、ChatGPT及下游细分板块均迎来集体大涨。截止发布,AI人工智能ETF(512930.SH)上涨3.58%。

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 视频版Midjourney又进化了:一句话生成视频

  • 提到国外的生成式AI大模型,文本生成领域有ChatGPT,图像生成领域有Midjourney和Stable Diffusion,那么视频生成领域有什么?很多人第一个会想到Runway公司的Gen-1。Gen-1是Runway
  • 今天,您的背影特别高大

  • 父亲节快乐Father's love is like a mountain“爸,我妈呢!”“爸,没钱了。”“爸,我想买这个。”我们与父亲的沟通往往不需要太多辞藻,就能够快速达到目的,这就是父爱——低调
  • 618防骗宝典来咯!

  • >>“反诈宝典”助您修成防骗神功<<网上交易要谨慎不轻信、不转账、不乱点不透露自己的身份信息如遇诈骗请及时拨打110618,祝大家购物愉快来源:公安部网安局
  • 金塔县:社会消费品零售总额平稳较快增长

  • 今年以来,金塔县商务局深入贯彻落实县委县政府“2166”发展思路,不等不靠、主动出击,坚持项目化清单化工程化推进落实,多措并举狠抓社会消费品零售总额平稳较快增长,促进商贸流