输入一段文字指令,瞬间生成1分钟有电影质感的逼真视频,奥特曼发布首个视频生成模型,连马斯克都说,心服口服。
属于春节假期的祥和犹在,大洋彼岸,英伟达、OpenAI、谷歌却已次第抛出重磅炸弹。2月13日,英伟达发布Chat with RTX,定位为个人电脑上的AI聊天机器人,业内人士解读其或将让每个人的电脑成为私有大模型;2月15日,谷歌推出Gemini 1.5 Pro,其稳定处理上下文的上限扩大至100万tokens,对比只支持12.8万tokens的GPT-4 Turbo,实力可见一斑。而最令人瞩目的莫过于来自OpenAI的Sora。
当地时间2月15日,OpenAI创始人阿尔特曼发布的首个视频生成模型Sora,其能够根据用户输入的文本描述,一次性生成多机位视频内容,一石激起千层浪。OpenAI因此估值飙升,市场预计其在最新一轮由风投公司Thrive Capital牵头的融资中估值有望超过800亿美元。与之对应的,部分如美国图片供应商Shutterstock等股价应声下跌,以Shutterstock为例,仅2月16日单日即损失近亿美元市值。
Sora究竟有何魔力能够如此引动资本市场风云?彼岸的蝴蝶扇动翅膀,将给中国影视频行业带来何种影响?国内AI领域的大小咖们又是如何评价Sora的?《浙商》杂志记者特别对话业内人士。
或将裁员70%,但再干5年问题不大
Sora究竟实力如何?这是Sora以“中国龙年春节”等为提示词生成的视频——
这是Sora以“时尚女性走在雨后东京街头”等为提示词生成的视频——
这是Sora以“穿过东京郊区的列车窗上的倒影”等为提示词生成的视频——
这是Sora以“太空人冒险的电影预告片”等为提示词生成的视频——
而竖屏超近景视角下,Sora所生成的动态蜥蜴更是细节拉满——
虽仍在内测之中,但如是逼真且艺术感的表现已让部分行业人士感到威胁。《浙商》杂志记者采访杭州某视频制作企业负责人时,对方对此先是半开玩笑地说:“研究了一天,裁员吧。”又回归理性分析,在他看来,当前Sora的开发仍是基于现有模型,但后续的自我迭代与增长是人类无法比拟和企及的,“再观望一下吧,目前来看,至少再干5年问题不大。”
“从科技发展的视角来看,我认为Sora的出现是积极的,推动文明进步的;从产业发展视角来看,产业升级是必然的,新事物必然取代旧事物。但从个体企业层面来看,如果这一应用得到普及,裁员是必然的,至少裁掉70%。毕竟,从管理者的角度来说,人会偷懒,而机器不会。”在该企业负责人看来,虽然机器或许无法拥有属于人的“灵光一闪”,但这并不能推导出“部分所谓创意含量高的岗位人无法被替代”的结论,“不过,新的岗位、新的行业会诞生,人或许会离开当前的岗位,但可以转行就业。就像百年前农活都属于人,而今有了机器,离开了黄土地的劳动力会有新的去处。”
而在好莱坞,AI工具已经正式开始进入电影制作环节。拍摄《当她醒来》恐怖电影的好莱坞导演戴夫·克拉克表示已经在使用AI工具制作电影。在他看来,Sora等AI技术带来的并不是威胁,创作者需要去拥抱AI技术,打造此前无法实现或是想象的内容。“这是改变游戏规则的技术。你不应该去担心自己的工作,而应该担心是谁在使用这些工具。”
行业调查公司CVL Economics上个月发布的一项对300位好莱坞行业领袖的调查显示,担忧情绪弥漫在整个好莱坞。72%的受访公司都是生成式AI工具的最早采用者;75%的受访者承认,生成式AI(工具、软件、模型)已经促使他们业务部门削减与合并工作岗位。这些掌控着好莱坞行业秩序的人们预计,未来三年好莱坞总计会有超过20万人的工作岗位会遭受AI冲击,尤其是视觉特效、音效师、画图师等后期工作岗位。
三六零集团创始人周鸿祎倒并不认同AI马上就能颠覆影视业的观点,“与其说会颠覆传统影视业,不如说会变成传统影视业的一个有力的生产工具。它能激发更多人的创造力。”他特别提到“科技平权”概念,“很多时候,普通人有很多好的想法,但没有办法去组织一个班子,去拍摄一部专业影片,但Sora给每个普通人提供了这种可能性,所以我觉得它更有可能成为创作者的有力武器。”
振奋?不安?当我们看Sora时,不能只看Sora
对话上文视频制作企业负责人时,他对记者坦言:“我对人工智能的未来持不安的态度,最好的方式或许是人机结合。”他说起电影《I,Robot》,其中提出“机器人三原则”,分别为——机器人不得伤害人类,或坐视人类受到伤害;机器人必须服从人类命令,除非命令与第一法则发生冲突;在不违背第一或第二法则之下,机器人可以保护自己,“但机器人最后发现,把人圈养起来,是服务人类的最好选择。”
事实上,从“元宇宙热”到“大模型热”,《浙商》杂志记者曾多次对话行业创业者、投资人、专家学者,他们对人工智能发展的态度大多是既兴奋又审慎。
“我们目前最担心的莫过于人工智能产生‘自我意识’,但自我意识并没有我们想象得那么神秘复杂。人脑中模块化地存储着大量外界输入的想法和信息,而所谓的自我意识,只是这些外界信息彼此竞争后的结果,哪个想法胜出,则占据主流。而大模型存储想法和信息的能力极强,缺少的只是‘想法竞争过程’的模拟能力,一旦这一竞争过程能够实现,它就能产生自我意识。这在技术上没有太大困难,只是伦理上仍存在许多问题。”人工智能和自然语言处理方向专家、智语科技联合创始人彭志宇说。
而人工智能迭变至今,究竟发展到何种程度?以OpenAI为例,周鸿祎分析,从Sora的发布来看,OpenAI除了GPT-5之外,或许还有更多秘密武器没有亮出来,在他看来,阿尔特曼是个“营销大师”,“这样看来,中国与美国在AI领域的差距,可能不但没有缩小,反而在加大。”
“Sora最让人惊叹的不仅是表象上作图的真实性,而是其实现了对现实世界的理解和模拟。”周鸿祎认为,这或许代表了技术的未来方向,“在对整个人类知识和世界模型了解的基础之上,以强大的大模型做底子,再叠加其他技术,就可以创造出各个领域的超级工具,例如医学、物理、化学等。”
在周鸿祎看来,大模型在这两年还会有新的突破,对物理世界的模拟至少会对机器人的具身智能和自动驾驶带来巨大的影响和突破,“原来自动驾驶过于强调感知层面,而没有工作在认知层面,并不掌握世界的物理规律。”他因此猜测,OpenAI会在自动驾驶方面交出一份令人“大惊失色”的答卷,“以视频作为训练素材,Sora训练所需要的算力、数据,所获得的知识将远远超过GPT-4,甚至GPT-5,如此一来,距离AGI(通用人工智能)的突破可能就不远了,或许也就只需要两三年的时间。”
不过,周鸿祎这一判断的客观度仍有待判断。
OpenAI在其公告中明确指出了其对现实世界理解的偏差,例如难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系,如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,会有一些凭空出现或消失;例如饼干被咬了一口后依然完整等。
Sora是有缺点的,且显而易见,但透过它,我们看到未来正以一种不完善却趋近完善的形式呈现。而人类手心所握的,究竟是AI匕首的“刀把”还是“刀刃”,似乎仍如迷雾,难探究竟。
来源:浙商杂志官方微信公众号 记者 李艳霄