服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

ChatGPT火遍全网,却有一大缺陷

日期: 来源:中国科学报收集编辑:中国科学报

文 | 吴飞(浙江大学人工智能研究所所长、浙江大学计算机科学与技术学院教授)


最近,聊天机器人模型ChatGPT可谓火遍全网。

去年11月30日,由美国人工智能实验室OpenAI推出的ChatGPT可完成类似人类的文本回复,涵盖事实信息、对话和创意写作等任务,具有改变企业与客户互动方式的潜力,适用于聊天机器人、虚拟助理、语言翻译和内容生成等多种应用场景。

人工智能技术长期积累的产物

ChatGPT的成功并非一蹴而就,而是源于以深度学习为代表的人工智能技术的长期积累。

早期神经网络技术秉承人工智能深度学习 “逐层递进、层层抽象”的基本思想,出现了诸如MCP神经元、感知机和前馈神经网络等模型。它们通常由多个处理信息且相互连接的“神经元”组成,其灵感来自人脑中所链接神经元之间的信息交换。

1949年,心理学家唐纳德·赫布指出,“神经元之间持续重复的经验刺激可导致突触传递效能增加,神经元之间突触的强弱变化是学习与记忆的生理学基础。”赫布理论为神经网络研究奠定了认知神经心理学基础。

在自然语言中,句子均由一个个单词前后相连组成。为了处理自然语言这一种序列数据,循环神经网络被提出。循环神经网络适用于处理自然语言这种序列数据,其特点是可存储前序信息将其作为上下文,以辅助句子理解。

2017年12月,Google发表了论文Attention is all you need,将自注意力机制引入以更高效学习单词与其上下文单词之间的共生关系,构建了被称为Transformer的模型。

研究人员一般采取一种“完形填空”方法来训练Transformer模型。给定一个句子,可从句子中“移除”一个单词,然后让模型根据剩下单词的上下文填空,预测最合适的“填空词”,通过这样的“自监督学习”不断强化模型能力。可以看出,通过“完形填空”就可使用互联网以及图书馆中海量语料自动训练模型,从而减少对昂贵标注数据的依赖。

由于ChatGPT需要完成的是聊天问答任务,研究者提出了一种“提示学习”方法改善模型。在该方法中,将答案句子中某个单词“移除”,然后把问题句子和答案句子拼合在一起,让模型预测被移除的单词。如此不断学习,模型就挖掘出了“问”和“答”之间的关联,具备了根据问题合成答案的能力。

ChatGPT还引入了人类反馈中的强化学习技术,将人类对其所提供答案的判断反馈给模型,以便对模型参数微调,提高语言模型回答的真实性和流畅性。

可见,人工智能现有基本模型是以逻辑推理为核心的符号主义AI、以数据驱动为核心的连接主义AI(深度学习)、以反馈控制为核心的行为主义AI(强化学习)。ChatGPT是对现有人工智能方法和技术的创新性整合。

技术特点和不足

在“数据是燃料、模型是引擎、算力是加速器”的驱动下,以深度学习为核心的人工智能正犹如水和电一样赋能人类社会。

ChatGPT恰如其分地体现了“数据、模型和算力”特点:ChatGPT的训练使用了45TB的数据、近1万亿个单词(大概是1351万本牛津词典所包含的单词数量)。使用了深度神经网络、自监督学习、强化学习和提示学习等人工智能模型。训练ChatGPT所耗费的算力大概是3640 PetaFLOPs per day,即用每秒能够运算一千万亿次的算力对模型进行训练,需要3640天完成。目前披露的ChatGPT的前身GPT-3模型参数数目高达1750亿。如果将这个模型的参数全部打印在A4纸上,一张一张叠加后,高度将超过上海中心大厦(632米)。

在大数据、大模型和大算力的工程性结合下,ChatGPT展现出统计关联能力,可洞悉海量数据中单词-单词、句子-句子等之间的关联性,体现了语言对话的能力。

ChatGPT以“共生则关联”为标准对模型训练会产生虚假关联和东拼西凑的合成结果,如ChatGPT认真回答“林黛玉倒拔垂杨柳”这样啼笑皆非的问题,就是缺乏常识下对数据进行机械式硬匹配所致。

2016年3月所出现的人工智能现象级产品AlphaGo以4:1击败李世石在互联网上激起了热烈讨论。虽然AlphaGo在迎战李世石之前,已经“阅览完毕”人类选手所有比赛棋局,并且通过自我对弈“华山论剑”海量虚拟棋局。但是,李世石在唯一获胜的一盘中使出了人类选手绝对不可能落子的一招,这一AlphaGo从未见过的落子使其无法从容应对而落败。可见,“数据驱动学习”模式下现有人工智能算法在挖掘共生知识方面固然表现出很强的能力,但是应用归纳、演绎、顿悟等能力获得新的创新知识更难能可贵。

同时,ChatGPT通过所挖掘的单词之间的关联统计关系合成语言答案,却无法明晰判断答案中内容的可信度,损害基于该模型研发的一系列具体应用模型的有效性,甚至引发偏见,传播与事实不符、冒犯性或存在伦理风险的毒性信息,产生技术伦理风险。

人和人造物的力量协同

1956年,人工智能从达特茅斯启航,经历了三起两落的曲折历程,今天我们很幸运地处于其第三次崛起过程中,这得益于深度学习在自然语言、计算机视觉和机器人等领域应用的成功。

1973年发表的“莱特希尔报告”对当时雄心勃勃构造“人类知识水晶球”符号主义人工智能提出了批评,认为“迄今的发现尚未产生当时承诺的重大影响”,人工智能跌入了第一次隆冬。BBC甚至于当年邀请科学家围绕“通用机器人是海市蜃楼吗”进行了一场电视辩论。

20世纪80年代左右,神经网络在实际应用中作用有限,使得人工智能跌入了第二次低谷。先后在麻省理工学院和加州大学伯克利分校任教的休伯特·德雷福斯教授以兰德公司顾问的身份,于1965年发表了《炼金术与人工智能》报告,将当时所进行的神经网络研究与历史上的炼金术相提并论,辛辣指出爬上树梢不等于攀登月球。

人工智能本身还在不断发展,将其等同于人类大脑是不切实际的想法,认为其超越人类则是杞人忧天。我们要认识到目前人工智能还处于完成特定任务的“就事论事”阶段,迈向通用人工智能是今后面临的长期挑战。人工智能是帮手,将人类从繁冗工作中解放出来,使得人类更专注于独立思考、综合判断、创新思维等工作。

在中国工程院院士潘云鹤看来,“未来将是人和人工智能共同进化的时代”“科学普及将人类进化中累积知识转化为人和人造物的力量”。

美国历史学家斯塔夫里阿诺斯在《全球通史》一书中赞誉“蒸汽机的历史意义无论怎样夸大都不过”,但是蒸汽机必须与纺织工业、冶金行业、交通行业等结合,才能推动人类整体迈入工业革命时代。

同理,电力和计算机等为代表的通用使能技术与其他技术结合,使人类先后进入了电气化时代和信息化时代。今天,人工智能已经成为一种通用使能技术,具有增强任何领域技术的潜力,被广泛应用于农业、制造、经济、运输和医疗等领域,发挥很强的“头雁效应”。

ChatGPT因人而生、因人反馈而演进,人和人造物协同迸发出赋能之力,凡贵通者,贵其能用之也!
《中国科学报》 (2023-02-13 第3版 综合 原标题为《ChatGPT:爬上树梢与攀登月球》)
排版 | 郭刚

相关阅读

  • 【译路同行】如何用阿语讨论ChatGPT?

  •   近期,智能聊天机器人程序ChatGPT引发各方广泛热议。下面就请跟随小编一起了解一下ChatGPT的有关阿文介绍吧!
      一、ChatGPT是什么?
    ما هو ChatG
  • 记者调查:ChatGPT火爆背后有何法律风险?

  • 调查动机最近,由美国人工智能研究室OpenAI开发的全新“聊天机器人”ChatGPT火了。作为一款人工智能语言模型,它不仅能和人展开互动,还可以写文章、制定方案、创作诗歌,甚至编写
  • ChatGPT火了,打工人哭了?

  • 图片来源:视觉中国-VCG111421248465最近,聊天机器人ChatGPT爆火,引发各界对人工智能(AI)概念关注讨论的同时,也令不少打工人“瑟瑟发抖”。这个由人工智能实验室OpenAI发布的“聊
  • 达摩院多模态预训练模型的轻量适配技术分享

  • 本文约4200字,建议阅读8分钟本文介绍了使用多模态预训练模型的轻量适配技术探索技术分享。
    BERT、GPT3 等预训练语言大模型已经被证明在 NLP 领域可以取得非常好的效果。随着
  • ChatGPT正在颠覆世界?谁有资格说话:AI还是人类?

  • 最近一周,如果要问什么是市场上最火的话题,ChatGPT敢说第二,没人敢说第一,作为足以颠覆整个市场的人工智能创新,ChatGPT已经牢牢占据各大媒体的头条,这次对于世界的冲击远比几年前
  • 2023年会是AIGC的产业大年吗?

  • 经济观察网 记者 邹永勤 它的问世,有可能带来一场新的工业革命;如果搭不上这班车,就有可能被淘汰。这两个“可能”,是360创始人周鸿祎于2月9日下午在与搜狐CEO张朝阳的直播对话
  • ChatGPT,影视编剧的朋友还是敌人?

  • 目前大火的ChatGPT诞生于2022 年11月,是由人工智能研究公司OpenAI研发的人工智能技术驱动的语言处理工具,也可以被视为一款人工智能聊天机器人。在其原型应用免费开放后的短

热门文章

  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • ChatGPT火遍全网,却有一大缺陷

  • 文 | 吴飞(浙江大学人工智能研究所所长、浙江大学计算机科学与技术学院教授) 最近,聊天机器人模型ChatGPT可谓火遍全网。 去年11月30日,由美国人工智能实验室OpenAI推出的ChatGPT
  • 俄罗斯莫斯科遇降雪天气 积雪达30厘米

  •   当地时间2023年2月12日,俄罗斯莫斯科,一场降雪后,一台除雪机正在清理街道上的积雪。根据Phobos气象中心的数据,莫斯科一夜之间的降雨量相当于月平均降水量的20%,积雪高达30厘
  • 看 “ 铁甲猛兽 ” 狂飙而来!

  • 铁甲猛兽,狂飙而来。伴随着发动机的轰鸣声,中部战区陆军第81集团军某合成旅装甲驾驶专业集训考核,在某装备训练场拉开了序幕。该旅为提高装甲车辆驾驶队伍实战化能力水平,着眼
  • “登上热搜”:关于网络传播评价体系的讨论

  • 主持人:钮迎莹嘉 宾:王方杰 重庆日报融媒体编辑部负责人高梦格 湖北日报融媒体中心微博编辑来 源:《青年记者》2023年第3期 主持人的话当下,信息数、粉丝数、转发数、评