AI绘画软件Stable Diffusion的前路--粉丝服务平台-粉丝头条-fensifuwu.com

AI绘画软件Stable Diffusion的前路

故事 12-23 来源：众乐乐娱乐法

作者：众乐乐娱乐法

2022年被称为AI绘画的元年。但是AI绘画技术并不是今年才兴起的，2018年佳士得的拍卖会上，AI绘画作品《埃德蒙德贝拉米》就拍出了43.25万美元（约合人民币300万）。但当时人们并没有将AI绘画太当回事，因为当时的AI作画技术有限，即使是拍出了300万人民币的《埃德蒙德贝拉米》，也只被认为是“一幅笔触不明的粗糙的肖像画”，“美术水平不见得有多高”；人们觉得只是靠代码生成的 AI 绘画始终无法和画家的才华相提并论。

AI绘画作品《埃德蒙德贝拉米》

图片来源：佳士得官网

https://www.christies.com.cn/lot/lot-6166184?ldp_breadcrumb=back&intObjectID=6166184&from=salessummary&lid=4

但时间进入2022年，AI绘画工具迎来了飞跃性的发展，并正以极快的速度迭代和进步。Disco Diffusion、DALL-E2、Midjourney、Open AI等，都是走在技术前沿的AI绘画软件。2022年8月22日，生成速度极快、且具有较高艺术观赏性的AI绘画算法Stable Diffusion宣布开源，再次让AI绘画成为讨论热点。

一、Stable Diffusion是什么？

Stable Diffusion是Stability AI公司旗下的产品，是一种文本到图像的模型。用户只要在模型中输入自己想要内容的文字描述，分秒之间就能够得到相应的图像结果，俗称“以文生图”。简单来说，它是一款AI绘画软件。

Stable Diffusion于2022年8月22日公开发布，其一开源，瞬间霸占GitHub热榜第一，一位 Reddit 用户在评论中赞叹：“Stable Diffusion开放还不到一周，这么多精彩作品真的令人惊叹。相信半年之后，它又会发展到完全不同的境界。”

二、Stable Diffusion火爆的原因

1.技术门槛低，上手快捷

Stable Diffusion的生成系统由现有艺术作品组成的巨大数据库训练而成，能够快速生成与提示信息有所关联的新奇图像，而且任何具备一点点技术知识的电脑用户都能轻松上手。它不用与Disco Diffusion一样让使用者面对复杂晦涩的代码，只需要输入指令便可得到结果。

为 Stable Diffusion 提供开发资金的 Stability AI 公司 CEO Emad Mostaque 在采访中表示：“这是一项堪称超能力般的外星科技。我们第一次见到一种老少咸宜的 AI 图像生成工具。”

2.访问通道广泛，极具开放性

Stable Diffusion与其他 AI 艺术生成器的最大区别，就是它高度关注开源取向。即使是之前游离于科技巨头之外的Midjourney，也从未如此广泛地开放其访问通道。Mostaque表示，正是这种开放性让Stable Diffusion获得了远超其他竞争对手的改进速度。

3.生成图像快且精准

在Stable Diffusion 之前，虽然还有Disco Diffusion、DALL-E2、Midjourney等其他的AI画作生成平台，但他们的图片生成速度都不及Stable Diffusion：Disco Diffusion生成一张图片以小时为单位；Midjourney生成一张图片以分钟为单位；而Stable Diffusion生成一张图片则以秒为单位。据说，Stable Diffusion在不到一个月的时间内，产出AI图画的数量已经超过了人类画家过去几十年在Artstation网站上作品的总量。

Stable Diffusion生成的图片

图片来源：AI前线

https://mp.weixin.qq.com/s/fwoEdmfF92Th603f1d3RTw

Stable Diffusion生成的图片

图片来源：机器之心

https://mp.weixin.qq.com/s/K-IzW2wOzQsLQ_4XTLJIVw

Stable Diffusion生成的图片

图片来源： Chitsing 觉悟之坡

https://mp.weixin.qq.com/s/O32Gr4E3UHOh55n2CDsfww

三、Stable Diffusion可能涉及的法律问题

1.不对生成内容进行审核/过滤，可能导致生成色情暴力图片

Stability AI 的开源方法之所以简单粗暴，就在于他们完全不对生成内容做任何审核或者过滤。用户可以轻松指控 Stable Diffusion 生成黄暴图像。虽然目前发布的稳定版本包含了一定的关键字过滤，用于阻止用户生成公开的政治或暴力图，但这种限制可以被轻松绕过，甚至Reddit上的 Stable Diffusion子版块就有“如何在5秒内移除安全过滤器”的帖子。

2.可能被用于各种犯罪行为，没有限制

正因为Stable Diffusion的开源，技术团队无法对所有内容进行审查，导致基于其模型的有害信息难以得到限制。虽然模型的开源许可证禁止人们使用该软件实施各类犯罪行为，不过只要把 Stable Diffusion下载到自己的计算机上，使用者完全可以肆无忌惮、不受任何约束。Mostaque也表示：“归根结底，使用者自己需要为如何使用这项技术负责，包括是否合乎道德和法律。人们当然可能用它生成糟糕的内容……”，这也从侧面表示了这项技术可能被公众用于进行违法犯罪活动。

此外，Stable Diffusion的限制不及同类产品。Stable Diffusion允许用户生成名人肖像、裸体等图像，甚至出现了基于Stable Diffusion模型的色情图片生成网站，但这些内容在DALL-E2和Midjourney中是禁止的，任何可能涉及血腥、暴力、政治、色情相关的描述，以及所有知名人物的名字，都在DALL-E2的违禁词之列。有网友甚至亲自对两项技术进行过对比实验，并表示：“你无法操纵 DALL-E2让它为你画一张特朗普和拜登接吻的照片，但Stable Diffusion 可以。” 言外之意，即 Stable Diffusion要更加随心所欲，生成一些违规的内容也更容易。

3.涉嫌侵害版权的问题

AI绘画涉及画师的版权问题已经是老生常谈的问题了。跟大多数现代AI系统一样，Stable Diffusion同样是在庞大的数据集上训练而成的，巨大素材包中包含50多亿张本应归于众多独立艺术家和专业摄影师所有的图像。同时，Stability AI在训练数据中保留下来的一类视觉素材，也属于受到版权保护的作品。

版权方面的争议，给 Stable Diffusion 这类AI绘画工具招来了不少批评，人们认为其可能涉嫌违反版权保护条例。担任艺术总监的 Logan Preshaw 就在最近关于 AI 艺术软件的热门推文中提到：“我最早以自由职业者的身份做过纸牌游戏插图、书籍封面和专辑封面等设计工作。但后来，这些行业开始充斥着 AI生成的图像，空有抱负的艺术家越来越难以生存，这真的让人心碎。每个人都有创作艺术的权利，但这不该以牺牲他人的利益为代价。”

判断AI绘画的画作是否侵犯版权，通用的判断标准是“接触+实质性相似”。但由于目前AI技术发展变化较快，素材选取随机性较强，糅合方法越发具有模糊性，“抄袭”的痕迹也容易从技术角度规避，因此该类案件在取证和举证方面还面临较为困难的局面。

四、AI绘画生成物的可版权性分析

AI绘画技术的发展日新月异，高超的AI绘画技术使得AI绘画作品已经很难和人类作品相区分，这便使得传统的著作权保护体系遭受了巨大的冲击。明确AI绘画生成物是否属于著作权所保护的对象是完善相关领域著作权保护体系亟需解决的首要问题。因为AI绘画生成物属于人工智能生成物的一种，所以接下来将以人工智能生成物为主体进行分析。

1.人工智能生成物构成著作权法意义上作品的可行性

学术界关于人工智能生成物是否构成著作权法意义上的作品的问题目前存在两种主要观点，一是肯定说，二是否定说。支持肯定说的学者认为，人工智能生成物尽管具有特殊性，但仍然是设计者意志的体现，可以构成作品。而支持否定说的学者则认为人工智能生成物并不具备构成作品所需之条件。一方面，人工智能生成物仅仅是算法运作的数个结果中的部分，并不能体现出创作者的个性，不具有独创性。另一方面，这部分学者认为人工智能生成物的创作主体是人工智能，而这并不符合《著作权法》对于作者主体的要求，因此也就无法将其归为作品。笔者认同肯定说，理由如下：

一方面，笔者认为人工智能生成物的创作主体仍然是自然人。目前为止，人工智能的发展仍然停留在获取和提炼信息，演绎与执行等智能操作层面上。尽管我们有时甚至难以区分人工智能和人对于生成作品贡献的大小，但是可以确定的是，这其中一定有人类实质性贡献的参与。事实上，现阶段的人工智能在创作作品的过程中仍然扮演者辅助工具的角色，其生成无体现的仍然是人的智慧和思想。人工智能对于人类创作的作用与工匠用电钻帮助雕刻的过程并无实质差异，区别只在于电钻这种机械工具替代的是工匠的体力劳动，而人工智能替代的则是人类部分的脑力劳动。

另一方面，目前世界上也已经有了司法实践和行之有效的法律制度可以予以佐证。如我国上海浦东新区法院即判定剧情类网络游戏的画面构成作品；应该在1998年及在其《版权法》当中即有“在没有人作为作者的情形下，由计算机生成的作品”的表述；WTPO也曾就此问题进行讨论，并认为对于符合作品构成要件的计算机系统生成物，原则上应当适用著作权予以保护。

2.人工智能生成物可版权性的判定标准

由前所述，人工智能生成物的创作主体仍然是人，这满足了著作权法对于作者主体的要求。在此前提下，只需讨论人工智能生成物是否满足构成作品的“独创性”要求，即可得出人工智能生成物可版权与否的结论。

笔者认为，对于独创性的判定可以采纳美国联邦最高法院的标准，即“独立完成”和“最低限度的创新”。即，只要人工智能生成物并非是对已有的他人作品的简单复制，可以在表达上予以区分，并排除公有领域的惯常表达即可被认为是具有独创性的表达。至于部分学者所主张的判定独创性的“美学标准”和“作者个性标准”，笔者并不认同。如若适用这些判定条件，软件作品等显然应受著作权保护的作品将被错误地排除在作品的范围之外。因此，这些标准可以作为判断作品独创性的考虑因素，而不能作为必要条件。

3.对人工智能生成物可版权性质疑观点的回应

有学者认为，随着科学技术的发展，人工智能的创作将会更加简单，其创作活动将会增多，而相应的，大量的人工智能生成作品会成为孤儿作品，这显然与《著作权法》鼓励创作的目的相悖。这一质疑观点无法自洽。因为目前世界范围内已有较为完善的立法例可以对这一问题进行解决，如英国《版权法》第57条第1款[8]即规定了法定许可模式：在使用人尽到了善意的查找义务而无法确定著作权人时，适用该作品的行为将被合法化。

有学者认为，如若坚持适用“最低限度的创新”标准，则对人工智能生成物的保护将会略显过分，而过分的保护会导致交易成本的增加，这反而不利于技术的创新。这一观点是不合理的，一方面，著作权法所规定的独创性指的是某作品与他人作品的区分度，而并未对创作水平进行限制。另一方面，如果仅仅以交易成本问题即提升作品的判定标准，将部分人工智能生成物归入公共领域，这无疑会打击人工智能研发者和投资者的热情，同样不利于创新。

综上，随着人工智能技术的不断进步，人工智能生成物对各行各业的渗透逐步深入。现行法律必须尽快确认人工智能生成物的可版权性问题，从而充分发挥知识产权法律体系的激励作用，促进人工智能产业和文化艺术产业的创新进步。

五、结语

以Stable Diffusion为代表的AI绘画工具还是一个新事物，无论是国内还是国外都对其的法律界定尚不明确，也只能依赖于各种AI绘画工具自身的软件规定和用户使用条款进行规制。但即使目前法律尚未对AI绘画进行明确的表态，我们也应该思考：作为普通人，我们对于Stable Diffusion这类AI绘画技术的态度应该是怎么样的？AI绘画工具的前路在何方？笔者始终认为，科技的发展是一条不可逆的道路，大家只能去适应和学习这些新的技术，然后为自己所用，让自己更具竞争力。

“历史的车轮呼啸而过，是选择跳上这辆车，还是停留在原地，都是个人的选择。但是无论你是否参与，它都不会因为你的看法而停下来。”以Stable Diffusion为代表的AI绘画技术似乎正摇旗呐喊，向艺术界宣告着一个新时代的来临。AI绘画的前路究竟是怎样的，我们拭目以待。

【参考文献】

[1] AI前线.AI绘画神器Stable Diffusion的疯狂与危险.[EB/OL].https://mp.weixin.qq.com/s/fwoEdmfF92Th603f1d3RTw.

[2] 艺非凡.AI夺得绘画大赛冠军，是抢饭碗还是开启艺术新纪元.[EB/OL].https://mp.weixin.qq.com/s/GdmUz0eJkBR1GUR6FqQXAQ.

[3] 网易雷火艺术中心.被AI端掉饭碗之前，原画师们还有哪些出路？[EB/OL].https://mp.weixin.qq.com/s/S6zIYSqdJz3Me15-J15s1A.

[4] 中国新闻周刊.当AI开始画画：画师会失业吗？[EB/OL].https://mp.weixin.qq.com/s/wCP_JWq86-SwaVblVspBMg.

[5]王果.论计算机“创作作品”的著作权保护[J].云南大学学报(法学版),2016,29(01):20-25.

[6]（2015）浦民三（知）初字号529号

[7] 李晓宇.人工智能生成物的可版权性与权利分配刍议[J].电子知识产权,2018(06):31-43.

[8] 英国《1988版权、设计和专利法案》第57条：

“经过合理调查(reasonable inquiry)仍不能确定作品权利人身份,并且有合理的理由推定版权保护期已过,或者作者应该于50年或更长的时间以前就去世了,那么对作品的利用就不属于侵权行为。”

[9]刘影.人工智能生成物的著作权法保护初探[J].知识产权,2017(09):44-50.