服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

生成式AI下一站:文本转视频

日期: 来源:高密融媒收集编辑:高密融媒

聊天机器人ChatGPT的爆红,让生成式人工智能(AI)成为科技领域的“当红炸子鸡”。除了如今“霸屏”的类似ChatGPT的语言模型之外,生成式AI领域还有大量其他技术:文本生成图像正在成为一种主流的聊天形式,而能够将文本转换成视频的生成式AI则是“羞答答的玫瑰静悄悄地开”,有望成为该领域下一个“大事件”。

但专家也指出,尽管文本生成视频AI有望应用于娱乐、艺术等诸多领域,但从技术到伦理道德等多方面都面临挑战。

文本生成视频初露头角

纽约人工智能初创企业朗韦(Runway)公司软件架构师伊恩·桑萨韦拉在电脑上输入了一段简短的文字:森林中一条宁静的河流。

约两分钟后,该公司开发的生成视频模型Gen-2就生成了一段短视频:在阳光的照耀下,河面波光粼粼,河水蜿蜒穿过森林和草丛,轻轻撞击岩石。

朗韦公司计划近期向少数测试人员开放Gen-2服务。该公司表示,用于图像和视频合成的深度神经网络正变得越来越精确、逼真和可控,也使人们能获得极其逼真且兼具美学艺术的图像,催生合成媒体的兴起。

据“数字趋势”网站3月27日报道,仅过去7天就有5款此类AI视频生成器面世:朗韦公司的Gen-2,美易(Picsart)公司的Text2Video-Zero、Video-P2P、TemporalNet,以及中国阿里巴巴公司研发的Text-to-video。

弄潮儿向潮头立!这些系统AI竞争进入下一个阶段,微软和谷歌等行业巨头和小规模初创企业纷纷入局。

据《印度时报》报道,早在2022年9月,元宇宙平台公司就展示了“制作一段视频”(Make-A-Video)软件。只需输入几个字词,软件就能制作出无声视频。谷歌公司紧随其后,推出了生成式AI模型Imagen Video。该公司称,给出一段文本提示,Imagen Video就能生成高清晰视频。该公司还展示了另一款模型Phenaki,目标是在输入文本的基础上,制作出长视频。

《纽约时报》的报道指出,这可能是技术领域的下一个重大事件,其重要性堪比网络浏览器或iphone的诞生。

相关技术亟待改进

不过,也有专家指出,这些AI软件的质量良莠不齐,面临一些技术挑战。

比如,桑萨韦拉生成的“清泉石上流”的视频时长只有4秒,如果细看,会发现画面不太连贯,画质也比较模糊,有时还会出现怪异、扭曲、令人不安的画面。

美国《Vice》杂志网站则在3月28日的报道中,将AI生成的“威尔·史密斯吃意大利面”的视频评为最怪异AI生成视频。在Modelscope生成的视频中,面容扭曲的史密斯看起来更像由他配音的电影《鲨鱼故事》中那条怪异的鱼,他试图将成堆的面条舀进嘴里,从叉子上或手中咀嚼大块意大利面。这是一个噩梦般的定格动画视频,仅由一行无害的文字生成:威尔·史密斯吃意大利面。

DeepMedia.AI是一家美国初创公司,其为美国政府构建数据集,为高精确检测“深度造假”内容提供支持,该公司创始人兼首席执行官瑞杰勒·古普塔4月4日接受媒体采访时指出,目前AI生成的视频存在两个主要的问题:首先,单帧并不完全逼真;其次,帧与帧之间的衔接并不流畅。不过,通过使用越来越多的数据训练,这种技术应能解决这些问题,快速提高和扩展这些文本生成视频系统的能力。

改良后的视频生成系统可加快电影制片人和其他数字艺术家的工作速度。专家认为,他们很快就能在这些系统的加持下,制作出配有音乐和对话、看起来非常专业的微电影。

有专家认为,未来AI生成视频有可能制作出可信且良好的内容,并唤起人类的情感。

“深度造假”值得警惕

这些系统还会成为一种快速制造难以觉察的网络虚假信息的新方式,使人们更难辨别互联网上的真实信息,深度伪造技术目前所带来的问题可能会变得更加严重。

美国麻省理工学院人工智能教授菲利普·伊索拉就表示,如果看到高分辨率的视频,人们很可能会相信它。还有专家指出,随着人工智能语音匹配的出现,以及逐渐拥有改变和创建几乎触手可及的逼真视频的能力,伪造公众人物和普通人的言行可能会造成不可估量的伤害,“潘多拉的魔盒已经打开”。

目前,已有公司在开发检测软件并将其集成到音视频媒体平台上。


相关阅读

  • 你莫信丨小心,你开的盲盒可能有诈

  • 欺诈套路深,谣言乱人心。揭穿各类陷阱!戳破种种谣言!湖南日报湘问频道、湘视频道联合推出视频栏目《你莫信》,帮你拨开迷雾、保持理智。欲知本期莫信啥,点开视频看看吧!为了大家
  • 几十秒看完10分钟的视频,就靠这个AI输入法。

  • 前两天,动作电影界出了个大新闻,三上要引退了。作为自己的启蒙老师,世超刷到这条推特后,心里能不急么。于是立马点开她发的视频链接,想看看她说了啥。不过,即便世超有多年日语观影
  • 优质视频创作课堂【1】:视频标题的基础规则

  • 各位创作者们大家好!一个好的标题往往是吸引用户来点击并观看视频内容的关键,那如何写好一个标题呢?一起来看看一个好的视频标题所必须具备的基础要求!题文一致、标题文字表达正
  • 小马云的抽象冒险

  • 15 岁,身高一米三,口齿不清,脑子也不太灵光。在这个本该上初中的年纪,他连数字还都不会写。他,就是“ 网红范小勤 ”。在很多短视频账号中,我们都能看到小勤的身影,或是客串,或是主
  • B站变BB空间?哔哩哔哩多名用户真人照片被上传

  • 作者 | 罗超慧编辑 | 十四月据网友反馈,近日,哔哩哔哩视频网站(下称B站)举办了一个二次元换脸活动,活动规则为:用户上传照片即可生成二次元形象图片。如果用户想要获得生成后的高
  • 绵阳一男子骑鸵鸟上路 交警:已进行了批评教育

  • 封面新闻记者 周洪攀近日,有网友举报称,“绵阳涪城区关帝镇有一男子骑鸵鸟上路,鸵鸟慢悠悠地行走在路边,很容易引发交通事故。”4月13日,绵阳市公安局交警直属五大队民警找到这

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 生成式AI下一站:文本转视频

  • 聊天机器人ChatGPT的爆红,让生成式人工智能(AI)成为科技领域的“当红炸子鸡”。除了如今“霸屏”的类似ChatGPT的语言模型之外,生成式AI领域还有大量其他技术:文本生成图像正在成
  • 春游踏青易招飞虫 这两种颜色的衣服最好不穿

  • ■对榕属植物提前进行监控并全面喷药。■摸清病虫害情况,对症下药。■走在路上,衣服上有时会出现密密麻麻的蓟马。气温回暖,不少市民会带着孩子到户外活动,踏青、赏花、野餐,此时
  • 数字经济服务质量满意度公布 多项指数大幅提升

  • 科技日报讯 (记者李禾)近年来,我国数字经济取得了举世瞩目的发展成就,对经济社会发展的引领支撑作用日益凸显。4月11日,科技日报记者获悉,中国质量协会日前公布了2022年数字经济服
  • 最高30度左右!菏泽进入升温“快车道”

  • 牡丹晚报全媒体记者 姜培军4月16日,牡丹晚报全媒体记者从菏泽市气象部门获悉,17日到20日,我市将进入升温“快车道”,最高气温将升至30度左右,利于菏泽大田牡丹的生长、开放。连日
  • 济南拟立新规,涉网约出租车、巡游出租车

  • 山东商报·速豹新闻网记者 金立红山东商报·速豹新闻网记者注意到,近日,济南市政府网站发布公告,对《济南市网络预约出租汽车经营服务管理实施细则(征求意见稿)》《济南市巡游出