人工智能模仿创造蒙娜丽莎的绘画艺术领域人工智能学贝多芬毕加索

当人们想到有史以来最伟大的艺术家时,他们可能会想到像贝多芬或毕加索这样的名字。没有人会认为人工智能是一位伟大的艺术家。但是如果有一天,情况确实如此。人工智能学会创造像蒙娜丽莎这样令人难以置信的绘画吗?也许有一天机器人将能够创作下一个伟大的交响乐。一些专家认为这是事实。事实上,人工智能领域的一些最伟大的人物正在努力开发能够独立于人类创作绘画和音乐的节目。谷歌等科技巨头甚至在艺术领域使用人工智能。

人工智能模仿创造蒙娜丽莎的绘画艺术领域人工智能学贝多芬毕加索本文包含的项目可能会对我们的日常生活产生严重影响。它们也可能改变我们对艺术的看法。他们还展示了人工智能领域取得的令人难以置信的进步。图像识别技术的研究并不遥远。在我们过去的伟大艺术家的造型中创造音乐的能力也不是。虽然这些话题将会被触及,但我们会专注于几个更高级的成果,例如将文字描述转化为图像,以及生成完全原创的艺术和音乐。这些项目中的每一个都为桌面带来了新的创意,并向我们展示了艺术空间是如何进一步探索人工智能应用的绝佳场所。我们将讨论这些项目中遇到的问题以及如何克服这些问题。AI的未来看起来很光明。让我们看看未来可能会持续多久。在这样做的过程中,我们可能会更好地理解人工智能在人类创造力驱动的领域可能产生的影响。

GAN及其演变形式

机器必须接受教育。他们从教学中学习。我们如何领导机器模拟已有的机器,并让他们创造新的技术?“没有创造性的艺术家会创造出今天的艺术,试图模仿巴洛克风格或印象派风格,或任何其他传统风格,除非试图讽刺”[4]。这个问题不限于绘画。音乐在某些方面可以是非常结构化的,但也是一种需要巨大创造力的艺术形式。那么我们如何去解决这个问题呢?我们将要讨论的第一个概念是GAN(Generative Adversarial Networks)。GAN虽然非常复杂,但已成为过时的模式。如果艺术领域的人工智能要推进,研究人员和开发人员将不得不努力寻找更好的方法来让机器产生艺术和音乐。Sketch-RNN和CAN(Creative Adversarial Networks)。这些方法中的每一种都比GAN有其优点。

首先,我们来探讨一下GAN究竟是什么。以下是解释GAN如何工作的小节选:生成对抗网络(GAN)具有两个子网络,一个发生器和一个鉴别器。鉴别器可以访问一组图像(训练图像)。鉴别器试图区分来自训练集的“真实”图像和由生成器生成的“假”图像。生成器尝试生成类似于训练集的图像而不看图像[4]。生成器创建的图像越多,它们越接近训练集中的图像。这个想法是,在生成一定数量的图像后,GAN将创建与我们认为艺术非常相似的图像。至少可以说这是一个非常令人印象深刻的成就。但是如果我们再进一步呢?

与GAN相关的许多问题仅仅是它能做什么的限制。GAN是强大的,但不能做我们想要的。例如,上述模型中的发生器将继续创建越来越靠近提供给鉴别器的图像的图像,该图像不产生原始艺术。GAN是否可以接受用户的培训?这不太可能。该模型无法将基于文本的图像描述转换为实际图片。和GAN一样令人印象深刻,我们都会同意它可以得到改善。提到的每个缺点都已经得到解决,并在一定程度上得到解决。我们来看看这是如何完成的。

草图RNN是Google开发的一种经常性神经网络模型。Sketch-RNN的目标是帮助机器学习以类似于人类学习方式的方式创造艺术。它已用于Google AI实验中,可以与用户并行绘制草图。这样做时,它可以为用户提供建议,甚至在用户决定休息时完成用户的草图。Sketch-RNN暴露于通过另一个Google应用程序获取的矢量图数据集提供的大量草图,我们将在后面讨论该应用程序。这些草图中的每一个都被标记为让程序知道草图中的对象。数据集将草图表示为一组笔划。这允许Sketch-RNN随后了解某个对象的每个草图具有哪些共同点。如果用户开始画一只猫,然后Sketch-RNN可以向用户显示可能在猫上的其他常见功能。该模型可能有许多新的创意应用程序。“通过各种课程训练的仅解码器模型可以通过提出完成草图的许多可能方法来协助艺术家的创作过程。”[3]。Sketch-RNN团队甚至认为,鉴于更复杂的数据集,应用程序可用于教育意义上,以教会用户如何绘制。单独使用GAN几乎无法轻松实现Sketch-RNN的这些应用。给定一个更复杂的数据集,应用程序可以在教育意义上用来教会用户如何绘制。单独使用GAN几乎无法轻松实现Sketch-RNN的这些应用。给定一个更复杂的数据集,应用程序可以在教育意义上用来教会用户如何绘制。单独使用GAN几乎无法轻松实现Sketch-RNN的这些应用。

用于改进GAN的另一种方法是Creative Adversarial Network。在关于对抗性网络生成艺术的论文中,几位研究人员讨论了通过CAN产生艺术的新方式。这个想法是,CAN有两个对手网络。其中一台发电机无法使用任何艺术作品。生成图像时没有任何依据。另一个网络 - 鉴别器经过训练,可以将生成的图像分类为艺术作品。当生成图像时,鉴别器给出生成器两条信息。首先是它是否相信生成的图像来自同一个经销商,与它所训练的艺术品相同,另一个是鉴别器如何将生成的图像适合其教授的艺术类别之一。这种技术的奇妙之处在于,它有助于生成器创建既能模仿过去的艺术作品的图像,又能从这种意义上了解这些图像和创意的优点,因为它被教导产生新的和不同的艺术概念。这与GAN创造模拟培训图像的艺术有很大的不同。最终,CAN将学习如何制作新颖的创新艺术品。

香草GAN的最后一个未来是StackGAN。StackGAN是一种使用堆叠式生成对抗网络的文字逼真图像合成器。鉴于文本描述,StackGAN能够创建与给定文本非常相关的图像。这对于正常的GAN模型来说是不可行的,因为即使使用最先进的训练数据库,从文本描述中生成照片般逼真的图像也非常困难。这就是StackGAN进来的地方。它将问题分解成两部分。“我们的Stage-I GAN生成低分辨率图像。在我们的Stage-I GAN的顶部,我们将Stage-II GAN堆叠起来,以生成符合Stage-I结果和文字说明的逼真高分辨率图像“[7]。通过对Stage-I结果和文字描述的调节,Stage-II GAN可以找到Stage-I GAN可能错过的细节并创建更高分辨率的图像。通过将问题分解成更小的子问题,StackGAN可以解决常规GAN无法解决的问题。下一页是显示常规GAN和StackGAN每个步骤之间差异的图像。

正是通过这些近年来取得的进步,我们才能继续推动人工智能所能做的事情。我们刚刚看到了三种改进已经非常复杂和创新的概念的方法。这些进步中的每一个都有实用的日常用途。随着我们对人工智能技术的不断改进,我们将能够在艺术和音乐方面做更多的工作,但是我们可以通过各种各样的任务来改善我们的生活。

DeepBach,Magenta和NSynth

图像不是人工智能可以影响的唯一艺术类型。我们说话时正在探索它对音乐的影响。现在我们将探讨一些具体的案例及其对音乐和人工智能的影响。在这样做的过程中,我们应该能够看到艺术如何为AI做出尽可能多的AI操作。这两个领域都从我们在这里探索的项目类型中受益匪浅。一台机器能否像Johann Sebastian Bach一样创造出一段音乐?在一个名为DeepBach的项目中,一些研究人员开始创作类似于巴赫合唱团的作品。DeepBach的美妙之处在于它“能够产生连贯的音乐短语,并且提供了例如不剽窃的旋律重新谐音”[6]。这意味着DeepBach可以创建正确结构的音乐并且是原创的。这只是巴赫的风格。这不仅仅是他作品的混搭。DeepBach正在创建新内容。DeepBach的开发人员继续测试他们的产品是否真的可以欺骗听众。

作为实验的一部分,超过1,250人被要求投票是否向他们呈现的作品实际上是由巴赫创作的。受试者具有不同程度的音乐专业知识。结果表明,随着DeepBach复杂性模型的增加,受试者越来越难以区分巴赫与DeepBach的合唱团。这个实验告诉我们,通过使用人工智能和机器学习,很有可能以伟人的形象重现原创作品。但是,人造智能在艺术和音乐领域可以做些什么?

DeepBach已经取得了不可思议的成就,但这绝不是AI可以为音乐领域带来益处的最大程度。如果我们想创造新的创新音乐怎么办?也许人工智能可以改变音乐创作的方式。必须有更多的项目来推动信封。事实上,这正是Magenta希望做的事。Magenta是由Google Brain团队执行并由Douglas Eck领导的一个项目。自2010年以来,Eck一直为谷歌工作,但这不是他对音乐的兴趣所在。Eck帮助发现了Brain Music and Sound,这是一个用于大脑,音乐和声音研究的国际实验室。他还参与了麦吉尔音乐媒体和技术跨学科研究中心的工作,并在蒙特利尔大学担任计算机科学副教授。

Magenta的目标是成为“促进音乐和艺术生成的机器智能技术发展水平的研究项目”[2]。这是一个使用TensorFlow的开源项目。Magenta的目标是学习如何以一种确实创造性的方式创作艺术和音乐。它必须通过模拟现有音乐。这与DeepBach的项目明显不同,该项目旨在以不剽窃现有音乐的方式模拟现有音乐。Eck和公司意识到艺术是关于捕捉惊喜元素并引起对某些方面的关注。“这可能是最大的挑战:将世代,注意力和惊喜结合起来,讲述一个引人入胜的故事。机器生成的音乐和艺术在很多小块中都很好,但缺乏任何类型的长期叙述弧。“[2]。

品红团队开发的项目之一就是NSynth。NSynth背后的想法是能够创造以前从未听过的新声音,但除此之外,还可以重新设计如何完成音乐合成。与专注于“振荡器的特定排列或采样回放算法,如FM合成或颗粒合成”[5]不同的普通合成器不同,NSynth在单个层面上产生声音。为此,它使用深度神经网络。Google甚至发起了一项实验,让用户通过融合现有乐器的声音,创造出前所未闻的新混合声音,真正了解NSynth能做些什么。作为一个例子,用户可以拿两把乐器,如班卓琴和大号,并拿出他们每一个声音的一部分来创建一个全新的乐器。

Magenta等项目向我们展示了人工智能在产生音乐方面所能做到的全部程度。他们探索可以产生独立于人类的新思想的人工智能的新应用。这是最接近我们来加工创意。尽管机器还不能真正思考和表达创造力,但他们可能很快就能够为我们创造出新颖独特的艺术和音乐。不过不要担心。Eck不打算用AI取代艺术家。相反,他希望为艺术家提供工具,以全新的方式创作音乐。

深刻的梦想和快速,绘制!

人工智能模仿创造蒙娜丽莎的绘画艺术领域人工智能学贝多芬毕加索,当我们展望人工智能已被用于在艺术领域完成新创意的几种方式时,我们将着眼于Quick,Draw等项目!和深度梦。这些项目展示了这个领域的惊人进步,同时指出了人工智能研究人员今后需要研究的一些问题。快,画!是谷歌创意实验室的一个应用程序,经过训练可以识别快速绘画,就像在Pictionary游戏中看到的一样。该程序可以识别诸如猫和苹果之类的简单对象,这些对象基于之前给出的许多图片的共同方面。尽管每次使用该程序都不会获得每张图片的正确性,但它仍会继续从所绘图片中的相似点以及之前的数百张图片中学习。

Quick,Draw!背后的科学!“使用了一些可帮助Google翻译识别您的手写的相同技术。要理解笔迹或绘画,你不只是看这个人画的东西。你看他们是如何真正吸引它的“[1]。它以游戏的形式呈现,用户绘制由应用程序选择的对象的图片。程序然后有20秒识别图像。在每个会话中,用户共有6个对象。然后将图像存储到用于训练应用程序的数据库中。这恰好是我们之前在Sketch-RNN应用程序中看到的相同数据库。这种图像识别技术在艺术和音乐领域是非常实用的人工智能技术。在我们的日常生活中,它可以为我们带来很多好处。但是,这只是开始刮擦人工智能在这个领域可以做的事情。虽然这非常令人印象深刻,但我们可能会指出应用程序并未真正理解所绘制的内容。它只是采取模式。事实上,这种区别是简单人工智能技术和真人工智能之间差距的一部分。真正了解图像中物体的机器似乎不会在不久的将来出现。

艺术领域另一个有趣的项目是Google的Deep Dream项目,它使用AI来创建新的和独特的图像。不幸的是,Deep Dream Generator团队不会对技术本身进行太多的细节(主要是担心电子邮件太长)[8]。然而,他们确实解释了卷积神经网络在着名的ImageNet数据集上训练。那些神经网络然后被用来创造类似艺术的图像。实质上,Deep Dream将一个图像的样式用于修改另一个图像。结果可以是从愚蠢的融合到艺术杰作。当程序识别用户提供的图像的独特样式并将这些样式强加到用户提供的另一图像上时,会发生这种情况。通过使用Deep Dream很容易观察到的是,电脑还不能真正理解他们在艺术方面正在做什么。他们可以提供复杂的算法来生成图像,但不能从根本上理解它们产生的是什么。例如,一台电脑可能会看到一把切开洋葱的刀,并假定刀和洋葱是一个物体。缺乏真正了解图像内容的能力是研究人员尚未解决的一个难题。

也许随着我们不断在人工智能方面取得进步,我们将能够拥有能真正理解图像中物体甚至是音乐诱发的情绪的机器。实现这一目标的唯一方法是通过实现真正的人工智能(AGI)。与此同时,Deep Dream团队认为,生成模型将能够创造一些非常有趣的艺术和数字内容。

我们从哪里出发?

对于本节,我们将考虑人工智能在艺术领域的走向。我们将看看AI如何影响这个空间,以及它如何继续这样做。我们还将研究艺术和音乐在未来几年会继续影响人工智能。虽然我不觉得我们已经完全掌握了模仿过去伟大艺术家的能力,但解决这个问题只是时间问题。要解决的真正任务是在艺术和音乐创造新的创新。我们需要努力创造而不是模仿。很明显,我们正通过CAN和Magenta等项目朝着这个方向前进。人工智能(AGI)不是完成这项任务的唯一方法。事实上,即使那些质疑AGI可能性的人也很难对一台机器创作出独特的艺术作品提出质疑。

通过人工智能进一步改善艺术和音乐的途径之一是创建更高级的数据集,以用于培训Sketch-RNN和Deep Dream等复杂网络。人工智能需要经过培训才能按预期执行。这种培训对我们得到的结果有巨大的影响。我们是否应该尽可能以最有利的方式培训我们的机器?即使开发像Sketch-RNN这样的软件来使用Deep Dream中使用的ImageNet数据集,在教育艺术家绘制复杂逼真图像的技术方面也是巨大的。复杂的数据集很可能是我们对更高效培训的答案。在我们的机器能够像我们一样思考和学习之前,我们需要非常小心使用哪些数据来训练它们。

艺术和音乐可以帮助影响人工智能的其中一种方式是提供另一种图灵测试机器的方法。对于那些梦想创造AGI的人来说,有什么更好的方法来测试机器创造能够测试人类创造力的全部能力的能力?艺术是人类创造力的最真实表现。事实上,这就是它的本质。虽然艺术可能不是人工智能的终极游戏,但它可能是测试机器能够达到的极限的最佳方法之一。计算机可以根据用户给出的描述创建原创音乐作品并创建图像的那一天,很可能是我们不能将人与机器区分开来的那一天。

结论

人工智能模仿创造蒙娜丽莎的绘画艺术领域人工智能学贝多芬毕加索,在音乐领域使用人工智能有很多好处。其中一些已经在我们迄今讨论过的项目中看到过。我们已经看到了人工智能如何用于图像识别以及将我们的文字转化为梦幻般的图像的能力。我们也看到AI如何被用来合成从未听过的新声音。我们知道人工智能可以用来创造与我们并排的艺术,也可以独立于我们。它可以被教导模仿过去的音乐,并可以创造新颖的想法。所有这些成就都是推动人工智能研究走向未来的一部分。谁知道?也许有一天我们将实现人造的一般智能,机器将能够理解它给出的图像中真正的东西。也许我们的电脑将能够理解他们的艺术如何让我们感受到。有一条清晰的道路向我们展示了从这里走向何方。我坚信,我们需要继续进行这项研究,并测试人工智能在艺术领域和日常生活中所能做到的极限。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();