2023年3月14日,具备多模态能力的GPT-4发布。据报道,GPT-4通过了许多人类专业测试,比如律师考试,也通过了一些经典心理学测验,体现出相当于9岁儿童的心智水平。
终于,那个问题开始在媒体报道与大众口中出现了:ChatGPT什么时候能通过图灵测试?
1950 年,“计算机科学与人工智能之父”艾伦·图灵在文章《计算机器与智能》中提出了一种用于判定机器是否具有智能的思想实验——“模仿游戏”,即图灵测试。
图灵测试的关键思想是,有关机器思维和智能可能性的复杂问题,可以通过测试人类是否能够分辨出他们是在与另一个人还是与一台机器在交互来验证。
如今,图灵测试被科学家用来评估应该在人工智能体上实现什么样的行为特征,才能使人类不可能将计算机程序和人类行为区分开。
1 有会思考的机器吗?
1956年往往被视为人工智能技术的奠基之年。那年,一个开创性的会议正式提出“人工智能”一词。
不过,实际上,研究人员至少早在20世纪40年代初第一台电子数字计算机诞生之时就开始思索“机器智能”和“会思考的机器”。
在早期,由于计算机主要用于对人类来说太过耗时的计算任务,所以认为计算机将承担诸如自然语言写作、作曲、图像识别或下棋等任务未免有些天马行空。
但是,那些塑造了这个领域的先驱者们并不缺乏远见。早在确实能够处理这些任务的软硬件被创造出来之前,克劳德·香农、诺伯特·维纳和艾伦·图灵等思想家就已经确信,实现这些只是时间问题8。
如果说许多人都很清楚电子计算机拥有承担越来越多任务的潜力,那么这个新兴领域所面临的挑战也同样清晰可见。
这种所谓的“智能”是什么?它与人类的智能相比如何?可以将计算机进行的电子和机械加工过程描述为“思考”吗?人类大脑的运转与借助数字运算实现的机器运转是否有任何本质上的类似之处?
哲学家托马斯·内格尔于20年后,即1974年发表的那篇举世闻名的论文《做一只蝙蝠是什么感觉?》(What Is It Like to Be a Bat?)中提出的论点可以很好地说明这个问题。内格尔表明,即使我们对蝙蝠的大脑和身体内发生的种种有精确了解,但仍无法评估蝙蝠是否有意识。由于意识是一种主观体验,人们需要“成为”蝙蝠才能做到这一点。
回到机器智能的问题上,尽管计算机取得了巨大成就,它们的“智能”也不会与人类智能有任何相似或相等之处。虽然我们所有人都基于自己的主观体验对什么是“思考”有一些理解,但我们无法知道其他人,尤其是非人类,是否有同样的体验。因此,我们没有客观的方法来知道机器是否在“思考”。
作为一位训练有素的数学家,哲学问题只是图灵的个人兴趣,所以图灵思想的哲学复杂性远远不及内格尔。毕竟,图灵的目标是描绘现代计算技术的前景,而不是发展关于思维的哲学。
不过,他在《计算机器与智能》的开篇表达了类似的顾虑。在绪论中,图灵为了宣布“机器能思考吗?”这个问题没什么用而对它进行了讨论。他表示,这是因为我们很难就“机器”和“思考”这两个词的含义达成一致。因此,他建议用另一个问题来代替这个问题,并由此引入“模仿游戏”作为一种更合理的解题思路:
这个问题的新形式可以用一个游戏来描述,我们称之为“模仿游戏”。
这个游戏有三个玩家,一个男人(A)、一个女人(B)和一个审讯者(C),审讯者可以是任何性别。
审讯者单独待在房间里,与其他两人分开。审讯者的目标是确定另外两个人中谁是男性,谁是女性……
现在问题来了:“如果扮演A的是机器,会发生什么?”审讯者判断出错的概率和他面对人类男性和女性时一样吗?
这些问题取代了我们原来的问题:“机器可以思考吗?”
与图灵相熟的朋友证实,图灵并不指望这篇论文能够作为刺激哲学家、数学家和科学家更认真地研究机器智能的宣传材料,也不指望它能对哲学或计算机科学作出多大贡献。
但是,不管他是否真的这么想,这个测试毫无疑问成了宣传该领域的绝佳工具。
“计算机大脑”可以在定义人类智能的关键能力之一,即运用自然语言方面击败人类吗?从这个威力强大的概念出发,图灵测试以一种直观而迷人的方式展示了人工智能的发展潜力。
在接下来的几十年里,它成为介绍计算机成就和潜力的流行读物的主要参考资料,并迫使读者和评论家思考人工智能的可能性——即使仅把它当作科学幻想或骗局来进行驳斥。
2 沟通游戏
媒介历史学家约翰·杜伦·彼得斯曾提出一个著名观点,即沟通(communication)的历史可以被解读为渴望与他人建立共鸣联系,并恐惧这种联系可能破裂的历史。
电报、电话和广播等媒介的出现都唤起了人们心中的希望和恐惧,即既希望它们能够促成这种联系,又担心它们提供的电子中介会使我们与他人疏远。
我们很容易就能看出,这一点也适用于今天的数字技术。在其相对短暂的历史中,互联网激发了强烈的希望和恐惧。例如,社交网络是促进了新的沟通形式的诞生,还是让人们变得前所未有的孤独?
在《计算机器与智能》之前,图灵在1947年撰写的一篇未发表的报告中曾幻想创造一种不同的、能够完全模仿人类的机器。这种弗兰肯斯坦式的生物是由传播媒介组合而成的机械化人类。
图灵写道:“着手建造‘会思考的机器’的一种方式是找一个完完整整的真人,再用机器取代他的所有器官。他将被装上电视摄像机、麦克风、扩音器、轮子、‘处理伺服机构’及某种‘电子大脑’。这当然是一项伟大的事业。”
尽管这段文字的语气极尽讽刺,但将它与马歇尔·麦克卢汉的名言放在一起来理解就更富深意了。麦克卢汉认为,媒介是“人的延伸”。换句话说,媒介提供技术代理,将人类的技能、感官和行动通过机械再现出来。
虽然图灵的备忘录是在1947年提交的,面世时间比麦克卢汉那如今已成为经典的著作早了近20年,但图灵的设想也沿袭了更古老的关于机械人类式生物的想象。
这种生物将摄影、电影和留声机等媒介作为人类器官和感官的替代品。就人工智能的历史而言,图灵那“找一个完完整整的真人,再用机器取代他的所有器官”的想象指出了媒介在为成功的人工智能创造条件方面的作用。
事实上,随后几十年里面世的各式系统证明了传播媒介的影响力。人们发送信息时对不同技术和界面的使用,即使没有直接影响这些程序的计算本质,也会影响其传播结果,即对人类用户产生影响。
在这个意义上,图灵测试提醒我们,如果不考虑传播中介的具体情况,就不能理解人类与人工智能系统的互动。
人类作为交流互动的参与者应该被视为关键变量,而不是被那些只关注技术性能的研究路径抹杀。此外,媒介和界面也会影响每一次互动的结果和意义。
在这个意义上,图灵的提案也许更像“沟通游戏”而非“模仿游戏”。
3 测试的意义
关于图灵测试已经有很多的讨论,有人可能会认为再没什么可补充的了。近年来,许多人认为图灵测试并不能反映现代人工智能系统的运作。
如果视该测试为“人工智能”标签下所有应用和技术的综合测试平台,并且不了解图灵本身其实拒绝解决“会思考的机器是否存在”这个问题的话,那么确实如此。
然而,当我们从另一个角度来看待图灵测试,就会发现它仍然为理解许多现代人工智能系统的意义和影响提供了非常有用的解题关键。
作者西蒙尼·纳塔莱以图灵测试为理论视角,揭示了关于人工智能系统的三个关键问题。
第一个问题是人类认知的中心地位。远在交互式人工智能系统进入家庭环境和工作场所之前,图灵等研究人员便意识到,计算机能够被称为“智能”的程度取决于人类如何看待它们,而不是取决于机器的某些具体特征。
从某种意义上说,这其实是失败导致的结果,即人们无法就“智能”一词的定义达成一致,也无法在没有置身机器之中的情况下评估其体验或意识性。
但是,这种认识注定会促进人工智能领域的非凡进步。人工智能是关于关系的现象,是存在于并且特别存在于人与机器互动中的事物。对这一点的了解刺激了研究人员和开发人员对人类的行为心理进行建模,以便设计出更有效的人工智能互动系统。
第二个问题是沟通的作用。由图灵在计算机互动工具极少、用户概念尚未出现的年代设想出的图灵测试,神奇地帮助了我们理解沟通在现代人工智能系统中的中心地位。
在计算机科学文献中,人机交互和人工智能通常被视为截然不同的领域:一个关注能使用户与计算机互动的界面;另一个关注如何制造能够完成智能任务的机器,如将文章翻译成另一种语言或与人类用户对话。
然而,正如我在本章中展示的,图灵测试为这两个领域提供了一个共同的出发点。无论这是不是图灵最初的意图,该测试的确提供了一个机会,让我们从人类与计算机的沟通如何嵌入系统的角度思考人工智能。
它提醒我们,人工智能系统不仅仅是计算机器,也是促成并规范用户与计算机之间特定沟通形式的媒介。
第三个问题即人工智能与欺骗的关系。图灵测试假定了一种人类审讯者很容易被计算机欺骗的情况,这表明欺骗问题在人工智能的酝酿阶段就已经引发了研究者的思考。
不过,测试所处的游戏情境使人们更多地考虑欺骗的娱乐性和表面上的无害性。在这个意义上,图灵测试的游戏性欺骗进一步证实了我的主张:我们应将人工智能置于欺骗性媒体,即功能中包含庸常欺骗操作的媒体的历史发展轨迹中加以考量。
*文本来源《媒介的欺骗性:后图灵时代的人工智能和社会生活》第一章,有删减
媒介的欺骗性:
后图灵时代的人工智能和社会生活
[意] 西蒙尼·纳塔莱 著
汪让 译
人工智能往往被形容成一种超越人类、如美梦又如噩梦般的存在。它引发了很多关于人类社会形而上学的思考。不可否认,人工智能正一点点改变我们的日常生活,但人工智能到底是什么?它对人类社会的重塑又是怎么发生的?
本书通过回顾人工智能技术的发展历史,揭露了人类关于这种技术的幻觉和谬论。聚焦于沟通型人工智能,作者指出它们并不是一种真正的“智能”,而是人类对自身的投射。人工智能技术利用文化偏见和现代心理学来匹配人类对外界环境的观察和探询,从而投射出“智能”的假象。
作者提出了“庸俗欺骗”这个概念来揭示人机互动的本质即欺骗,并详细阐述了“庸俗欺骗”的各个维度。所谓人工智能,无非是利用投射和刻板印象来附和社会规范罢了。透过人工智能技术,我们恰好可以看出人类是多么容易受到欺骗。在各种科技的不断兴起中,我们人类也被逐渐改变。只有深刻理解人类面对媒介骗局的脆弱性,我们才能成为更加成熟审慎的媒体消费者。