服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

过去70年人工智能领域 - 最苦涩的教训

日期: 来源:周喆吾收集编辑:Richard Sutton

原文是Richard Sutton 2019年写的,从今天回看,一篇雄文 Attention Is All You Need 碾压了多少 NLP研究员的光荣与梦想 ... 这个教训,太深重!


The Bitter Lesson(英文原文在“阅读原文”里)

过去70年人工智能研究领域最重要的一堂课,是只有通用计算方法(蛮力计算 brute-force)最终是最有效的,而且优势很大 —— 因为摩尔定律,每单位计算成本持续呈指数下降。大多数人工智能研究都是假设 Agent 可用的计算量是恒定的(在这种情况下,利用人类知识将是提高性能的唯一方法之一),但是,在稍长的时间里看,可用的计算量必然会大大增加。为了在短期内获得改善,研究人员试图启用本领域内的现存人类知识,但长远来看,唯一重要的是利用算力。基于人类知识的方法往往很复杂,不太适合利用好通用算力。有许多人工智能研究人员迟迟未能学习这个苦涩的教训的例子,回顾这些年的一些最突出的例子是很有启发性的:

在电脑国际象棋中,1997年击败世界冠军卡斯帕罗夫的方法基于大量的深度搜索。当时,许多计算机国际象棋研究人员对此感到失望,他们一直致力于利用人类对国际象棋特殊结构的理解的方法。当一种更简单的基于搜索的方法,结合特殊的硬件和软件,取得了更大的成功时,这些基于人类知识的国际象棋研究人员没有虚心接受失败。他们反驳道,“粗暴的”搜索可能这次赢了,但这不是一种通用的策略,而且也不是人们玩国际象棋的方式。这些研究人员希望基于人类的行棋思路获胜,当它没有获胜时他们感到失望。

在电脑围棋中,也出现了类似的研究进展,只是比国际象棋晚了20年。最初的巨大努力是避免用蛮力搜索,而是想办法利用人类知识(一千年的棋谱),或游戏的特殊特征,但是所有这些努力都被证明是无关紧要的。更糟糕的是,一旦有效地进行了大规模搜索,这些努力都是负向的。同样重要的是使用自我对局来学习价值函数。自我游戏学习 以及 通用学习 一般来说,就像搜索一样,它能够吃掉大量的算力。在电脑围棋中,就像在电脑国际象棋中一样,研究人员最初的努力是利用人类的理解(因此不需要太多的搜索),只有在后来才通过拥抱搜索和学习取得更大的成功。

语音识别方面,20世纪70年代有一场早期的竞赛,由美国国防部高级研究计划局赞助。参赛者包括许多利用人类知识的特殊方法——知识词汇,音素,人类声道等等。另一方面是更统计学的方法,它们做了更多的计算,基于隐马尔可夫模型(HMMs)。再次,统计学方法胜过基于人类知识的方法。这导致自然语言处理领域出现了一个重大变化,几十年来,统计学和计算逐渐主导了这一领域。语音识别中最近深度学习的兴起是这一持续发展的最新一步。深度学习方法甚至更少地依赖于人类知识,使用更多的计算,加上在巨大的训练集上的学习,来产生更好的语音识别系统。正如游戏中一样,研究人员总是试图制造出研究人员认为自己的大脑运作方式的系统——他们试图把这些知识放入他们的系统中——但最终证明是适得其反,是研究人员时间的巨大浪费,当摩尔定律使得大量算力变得可用,并找到了一种将其用于好处的方法。

计算机视觉/CV领域,也有类似的模式。早期的方法把视觉想象成寻找边缘,或广义柱,或以SIFT特征的形式。但今天这一切都被抛弃了。现代的深度学习神经网络仅使用卷积和某些不变性的概念,并且表现得更好。这是一个重要的教训。

纵观整个AI 人工智能领域,我们仍然没有彻底地学习到这个教训,因为我们仍在犯同样的错误。要看到这一点,并有效地抵制它,我们必须理解这些错误的吸引力。我们必须学习苦涩的教训,即把我们认为的思维方式构建到系统中是行不通的。

苦涩的教训是基于历史观察,即 1)人工智能研究人员经常试图把知识构建到他们的代理中,2)这在短期内总是有帮助的,并且对研究人员来说是个人满意的,但3)从长远来看,它总会达到一个瓶颈,甚至会阻碍进一步的进展,4)突破性的进展最终是通过一种相反的方法——基于搜索和学习的大规模堆算力——而获得的。

从苦涩的教训中应该学到的一件事是通用方法的巨大力量,即随着可用算力的增加,这些方法仍然可以继续扩展。似乎可以以这种方式无限扩展的两种方法是搜索和学习。

从苦涩的教训中学到的第二个普遍点是,人类心灵的实际内容是极其复杂的,我们不应该再试图找到简单的方法来思考心灵的内容,比如简单地思考空间,物体,多个代理或对称性。所有这些都是任意的、内在复杂的外部世界的一部分。它们不应该被构建,因为它们的复杂性是无止境的;相反,我们应该构建可以找到和捕获这种任意复杂性的元方法。这些方法的关键是它们可以找到良好的近似值,但算法应该是基于我们的方法(如学习),而不是我们已经学到的知识。我们希望AI Agent 能够像我们人类一样去发现,而不是在系统里集成我们已经发现的知识。

相关阅读

  • 解放军报评论员:努力推动构建人类命运共同体

  • 努力推动构建人类命运共同体——五谈学习贯彻习主席在十四届全国人大一次会议上的重要讲话■解放军报评论员“中国的发展惠及世界,中国的发展离不开世界。”习主席准确把握新
  • 从GPT/AGI到未来世界的政治

  • 兔主席 20230317 题目看似很大,也只是闲聊。难道不是一个特别有趣的问题么? GPT是最近最热的话题。国外有不断迭代的ChatGPT(已经到了GPT-4)以及其他平
  • 小红书CPS引流项目训练营1.0,仅剩最后5位名额!

  • 大家好,我是黄岛主!今天给大家带来的是副业项目是:小红书CPS引流变现项目这个项目很多人再熟悉不过了,主要是在小红书上去引流并变现,那么这个变现和我们以前变现方式不一样,我们
  • 王通:个人品牌变现系统(免费直播)

  • 周六下午三点中,我将开一场专场直播,公开分享个人品牌变现的5个方法,以及打造个人品牌的五个步骤。‍‍‍‍‍‍‍‍‍点击下面链接关注直播!‍‍‍‍‍‍‍‍推荐文章:王通:第3期
  • 百度网盘高速下载方法,目测速度5M/S!

  • 啰嗦几句昨天小伙伴给我发了百度网盘加速下载的方法,我今天上去测试了,发现是真的好用,所以来给大家推荐推荐~~~软件介绍Cheat Engine加速方法Cheat Engine是一款专注于游戏的

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 又是大涨的一天

  • 研报新能源汽车产业链现在到底有多悲观?就这几个月。从材料到电池,再到下游的汽车厂,整个行业的市值都在大缩水。恩捷股份是做隔膜的,市值从最高的2800多亿跌到现在还不到1000亿