服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

ChatGPT取代搜索引擎?谷歌急了,百度不慌:早已布局

日期: 来源:量子位收集编辑:量子位

梦晨 衡宇 发自 凹非寺量子位 | 公众号 QbitAI

生成式AI要取代搜索引擎的声音,出现在ChatGPT发布的第一天。

后来越传越邪乎,有人设想以后大家找资料都不说google一下了,而是geept一下。

还有人说,搜索引擎给的一页10个蓝蓝的链接,以后就像老式拨号电话的转盘一样成为历史。

谷歌刚开始还满不在乎,随着ChatGPT爆火出圈也感受到威胁,内部拉响红色警报,调整AI产品策略。

微软则把这视作弯道超车的机会,计划在必应搜索中继承ChatGPT的能力。

……

不过,持不同观点的也大有人在。

随着大家使用加深,ChatGPT会用权威的语气输出错误信息,无法获取最新知识等弱点暴露出来。

△一本正经胡说八道

OpenAI的CEO也表示,现阶段ChatGPT容易给人带来一种假象,依赖它来做重要事情是不靠谱的。

Keras之父则认为,搜索与生成根本就是两个问题,原理上就决定了两者无法相互取代。

有意思的是,另一搜索巨头百度的观点也站在这一边。

近日,百度刚刚举办Create AI开发者大会,大会前夕,百度搜索宣布将基于百度自研的生成式模型,升级“生成式搜索”能力,并指出,生成式AI和搜索引擎是互补关系而不是替代,还说搜索底层技术和AI底层技术是相通的。

其实你已经用上了

百度这番话不是说说而已,而是从2021年就开始尝试把AIGC与搜索两者结合起来了。

十年前点击“百度一下”的按钮时,搜索引擎背后的工作原理相对简单,就是通过关键词索引,经过算法筛选排序,生成结果页。

而现在,结果页有时候已经不是单纯呈现链接排列。

比如,买了新款iPhone的你,把手机翻了个底朝天,也没找到录音功能藏在哪。

无奈求助于百度,在搜索框输入“苹果怎么录音?”,生成页面最顶端出现的不是链接,而是一个小卡片。

AI选出最能帮到你的答案并做摘要,显示在最上方,无需再从搜索结果翻找。

点进去看,还是图文并茂,步骤清晰的那种。

(世界未解之谜:苹果的录音机到底为什么要叫语音备忘录???)

又或者网络冲浪时看到一帧截图,想要知道出自哪部剧,描述一下,搜索引擎可基于深度语义理解问题并匹配结果,也能搜出答案来。

不信可以一起口语化描述下面这张剧照,“韩国有部电影野兽轮船在空中飘着叫什么名字”,然后在评论区告诉我们答案。

再比如,想了解“北京GDP和上海GDP谁高”,百度可以基于权威数据自动生成多年两地GDP走势图。

高低对比直接呈现,不用自己分别另行搜索和自行计算。

这些功能背后都是AI技术在支撑,也是AIGC和搜索技术的结合,只是用起来过于顺滑,大家习以为常了,就像手机上的指纹识别一样。

搜索引擎虽然有20多年历史,但对大多数网民来说仍然是难以替代的高频刚需,并且需求也一直在变化。

从简单的关键词命中搜索,到自然语言搜索,再到语音(特别是方言)搜索,人们使用搜索引擎的方式越来越靠近本能和直觉。

从基础的把网页当成文档去搜索,到搜索知识、服务,人们越来越期待搜索提供更大的价值。

由此带来的复杂需求与庞大计算量,使搜索依然是技术壁垒非常高的产品。

据了解,自百度发力AI十年来累计研发投入超过1000亿元,每年研发占比都超过15%,2021年更是达到23%。

与此同时,搜索则是百度20年来的核心业务,也是离大众最近的“窗口”之一,每天处理海量的请求。

百度领先的AI技术都会最先落地在搜索上,让搜索不断跟上需求的发展,同时也是AI技术最好的试炼场。

两大“杀手锏”技术公开亮相

提起百度的AI技术,最被人熟知的是文心大模型,产业级、知识增强是其特色。

背后还有飞桨深度学习平台,提供一系列基础设施和工具。以及更底层的自研昆仑芯片,兼具超强算力与高性价比的成本优势。

那么这些技术怎么用于搜索引擎呢?

这就要说到在百度Create大会上亮相的两大“杀手锏”技术,跨模态大模型“知一”,新一代索引技术“千流”。

先看跨模态大模型知一,是AI技术在搜索场景落地的代表。

简单来说,知一大模型可以从全网形态各异的资源中持续学习,无论是文本、图片、视频还是结构化信息都可以融会贯通。

打破了资源形态的界限,就更容易理解用户的搜索需求。

从技术层面讲,知一使用了百度文心大模型技术。大规模预训练技术提升模型性能,蒸馏压缩率高达99%的模型小型化技术以降低成本,得以在搜索场景全面应用。

据了解,目前知一在百度搜索的各场景中每天要进行上万亿次的推理。如此巨大的使用规模又带来新的问题,如何把满足需求的结果高效呈现给用户。

这就要提到新一代索引技术千流,负责把不同维度的信息进行智能有序的组织。

千流与之前的索引技术相比,主打多领域、多维度表达的立体栅格化索引。

如何理解栅格化?

在过去,搜索引擎为提高效率会把内容按质量横向切开,做分层处理。先从高质量内容开始检索,满足需求就可以及时返回结果,还未满足再进入下一层。

在千流中,进一步把质量最高的一批内容按领域垂直分层。质量分层+内容命中结合,一横一纵把内容切分成栅格按需检索,大大减少每次检索的计算量。

这是对搜索引擎后端架构的彻底改造,做到成本降低一半、速度快两倍。

但这又不光是节省成本的问题。

百度工程师透露,节省下的计算量还可以投入到对内容的精耕细作中,如综合利用多种算法提升索引质量,或者加入最新的生成式AI技术。

此外,在不同的栅格间也可以使用个性化算法,就好比“一鱼多吃”,不同的部分使用不同的烹饪方法。

知一和千流两者配合起来,一方面对用户搜索意图的理解更精确,一方面提高内容的质量和信息检索效率,为搜索打开了更多可能性。

用户的高频需求,驱动着AI技术变革。新技术又能激发新用户需求表达,两者构成“双轮驱动”,持续推动搜索进化。

在这样不断反馈迭代之下,下一个质变即将到来。

搜索即创作

回到最初的话题:生成式AI会取代搜索引擎吗?

作为国内最大的搜索引擎,百度的答案已经明了:

AIGC和搜索引擎是互补而非取代关系。

百度搜索杰出架构师辜斯缪解释了百度如此判断的思维路径:

当前的AIGC对话系统,哪怕是最火最出圈的ChatGPT,尚有自身能力的明显瓶颈, (比如有时胡说八道,以及不能及时获取最新消息) ,且不能保证未来技术一定能够解决这些问题。

因为从工业应用和落地可能性角度看,现有模型规模并不能支撑一个模型能记录所有知识。

尤其是用户需求量巨大的强时效性内容。

解决办法,就是换个角度,利用AIGC为用户开放式的搜索提问或定制化的信息需求“创作答案”。

从单边的搜索或生成,融合为检索+生成,会达到更好的效果。

这也是从2021年,百度就已经着手研发生成式搜索的重要原因。

检索和生成的结合模式,注定了百度搜索升级后的产品形式会有变化。

据了解,最终产品会与ChatGPT有很大不同,即虽是多轮交互,但并非单纯的多轮对话。

简而言之,用户可以更高效地向搜索引擎提出需求,生成式搜索则在满足需求的同时,迭代和调整这个需求。

不会PS的人,可以利用生成式搜索搜出一张图片,再用语言描述想要怎么修改这张图片,搜索引擎就能根据要求,通过百度的NLP技术对图片进行修改,给予反馈。

升级后,生成式搜索会实现三个方面的体验提升。

信息智能整合组织。在保证权威性和准确性的前提下,梳理检索结果,提供整合后的结构化答案。内容创作。基于文心·NLP大模型,发挥自然语言处理能力,可以满足诸如“写文章”“写公告”“智能聊天对话”等创作型搜索需求。个性化内容体验。基于不同用户画像和阅读偏好,同一内容也有差异化、个性化的具体表达。

△「内容创作」示意效果图

据介绍,百度即将在近期升级全网首个生成式搜索。

提纲挈领地梳理下来,不论是AIGC,ChatGPT,还是生成式搜索,都是技术、尤其是AI技术发展到一定地步产生出来的新的机会。

如2022年底,百度CEO李彦宏在全员大会上的发言所说:

把AIGC这么酷的技术变成人人需要的产品,这一步才是最难的。

百度生成式搜索会是下一个人人需要的“酷”产品吗?

拭目以待。

相关阅读

  • 甘肃酒泉职业技术学院升本,加速!

  • 酒泉职业技术学院,这所高职院校升本步伐要加速了!酒泉市政府网站2022年12月11日发布的《2022年政府工作报告》明确:加快创办酒泉职业技术大学。《报告》中的“2023年政府工作”
  • 突破美方封锁,这类芯片开始量产

  • 据台湾“中时新闻网”1月8日报道,用先进的封装技术连接功能不同的数个芯片以达到先进制程芯片功能的小芯片(又称晶粒)技术,被视为中国突破美国芯片科技禁运的快捷方式。长电科技
  • 百度CTO王海峰:AI发展进入“深度学习+”阶段

  • 封面新闻记者 付文超1月10日,百度Create AI开发者大会举办。百度首席技术官王海峰表示,当前规模化的AI大生产已然形成,深度学习从技术、生态、产业等多个维度逐渐成熟,人工智能

热门文章

  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 每年救助最高3万元!事关武汉这些人就医

  • 近日,武汉市人民政府在官网上发布《市人民政府关于印发健全重特大疾病医疗保险和救助制度工作的通知》对医疗救助对象,重症医疗救助方式等多个方面都有明确规定事关你的医疗救
  • 最新!夏林茂、于英杰任北京市副市长

  • 据北京日报1月11日消息,1月11日,北京市十五届人大常委会第四十七次会议表决决定:任命夏林茂、于英杰为北京市副市长。根据杨晋柏同志请求,按照地方组织法和市人大常委会任免国家
  • 在“浙”里,遇见“神奇”

  • 青海·海西第二届“神奇柴达木”农畜产品区域公用品牌推介会暨绿色有机农畜产品输出地产销对接会海西蒙古族藏族自治州因位于美丽的青海湖以西,故名海西。它地处青甘新藏四省