详解ChatGPT插件如何开启AI操作系统
摘要
高于操作系统战略的地位Plugin。通过多插件的相互协同构建私人定制的人工智能管家将是OpenAI的未来形态。通过ChatGPT 释放出的第一批第三方插件中,基本全方位覆盖衣食住行、情感交互、工作以及学习等日常所需。而相关插件的能力将通过ChatGPT Plugins的三大基础套件:Browsing(联网插件)、Code Interpreter(代码编程器)以及Retrieval(知识检索插件)目前通过多类插件的协作,可以实现多应用的协同,其本质上类似于24x7的私人助理。
不可忽视的战略意义:复制苹果生态的伟大历程。OpenAI正沿着类苹果模式的“终端+平台+生态”,迈向高于操作系统的战略地位。引入插件Plugin标志ChatGPT走在创建生态系统的伟大道路上,统一平台+插件的模式有望构建与苹果+App Store相似的繁荣生态。复盘苹果生态模式发展进程,我们发现ChatGPT已经具备全部的先决条件:
通过ChatGPT划时代的交互方式抢占终端的制高点,对标iPhone 4发布;发布Plugin并推出“交互+编程+个人助手”三大套件,对标 APP Store模式,打造苹果式的手机体验;宣布接入海量应用插件,在统一平台上形成功能相互协同=App Store通过排行榜、搜索等方式帮助iPhone用户快速找到想要的应用程序的 “苹果平台”商业模式。
ChatGPT自身的三大套件是构建海量插件相互协同的核心抓手,其目的是通过将多插件形成对用户的全方位覆盖,最终形成专属个人的AI管家。从ChatGPT的首批接入的插件厂商即可看出OpenAI的目标是覆盖人类生活的全维度。通过调节和协作相关插件,ChatGPT从本质上转变为每个人的私人助理。当个人可以通过同一平台同时安排衣食住行、工作、娱乐乃至教育的任务部署,将构建不可打破的高粘性,并反哺于GPT模型的优化,最终进一步扩展ChatGPT-PlugIn的战略宏图。
投资建议: ChatGPT-PlugIn通过多款插件对多行业全方位覆盖,国内对标公司也受益于此次技术革新,在统一平台部署各类应用,强化客户粘性。在ChatGPT通过Plugin开启迈向迈向操作系统的关键信号,推荐映射至国内具备稀缺性的三六零以及同花顺,建议关注寒武纪-U;同时推荐首批插件的国内对标公司:而我们进一步梳理首批插件的国内对标公司,其中石基信息面向酒店及出行预定以及订餐;四维图新通过华为花瓣地图涉及超市运送板块;科大讯飞、金桥信息涉及的法律咨询领域;中科创达作为无代码集成平台的映射标的。
风险提示:技术落地不及预期,竞争格局加剧。
1 高于操作系统战略的地位Plugin
OpenAI发布ChatGPT的插件系统Plugins,将是人工智能领域的革命性突破。ChatGPT Plugins作为非常实用的插件系统,它可以帮助不同类型的用户更轻松、高效地完成任务。该系统不仅可以让初级程序员通过自然语言编程来轻松地开发应用程序,还具有实时性、精度、安全性和易用性等方面的优点,满足了不同类型用户的不同需求。
ChatGPT Plugins作为基于自然语言编程的插件框架,旨在帮助用户完成各种任务。目前通过多类插件的协作,可以实现多应用的协同,其本质上类似于24x7的私人助理。
根据OpenAI的官网展示,只需在插件商店安装WolframAlpha ( 科学计算插件 )、 OpenTable ( 订餐插件 )、 Instacart ( 购物插件 )等三款插件,即可实现同时要求特定餐厅的预定、食谱的制定、热量的计算和食材的订购等。
通过多插件的相互协同构建私人定制的人工智能管家将是OpenAI的未来形态。通过ChatGPT 释放出的第一批第三方插件中,基本全方位覆盖衣食住行、情感交互、工作以及学习等日常所需。而相关插件的能力将通过ChatGPT Plugins的三大基础套件:Browsing(联网插件)、Code Interpreter(代码编程器)以及Retrieval(知识检索插件)
实现在统一平台上相互协调,从而形成应用程序协同执行广泛场景的各类任务。
1.1 Browsing(联网插件):打破ChatGPT知识鸿沟
通过Browsing(联网插件),打破之前ChatGPT的训练数据库仅更新至2021年的限制。通过此插件将允许ChatGPT可以访问互联网,OpenAI表示,“在WebGPT、GopherCite、BlenderBot2、LaMDA2等一系列工作的激励下,允许语言模型从互联网上阅读信息,这将严格地扩大其可以讨论的内容量,从培训语料库直到当下的新鲜信息”。
在具备安全的前提下,Browsing 插件会显示访问的网站,并在 ChatGPT 的回复中引用来源。ChatGPT继承微软在信息的来源可靠性和真实性以及防止检索有问题内容的“安全模式”方面的大量能力,并具备显示显示访问的网站,以及在 ChatGPT 的回复中引用来源。以近期热点,第九十五届奥斯卡颁奖典礼为例。此前,ChatGPT会指出,其训练数据没有包含足够的信息来让它回答。如今在“网络浏览器”的支持下,ChatGPT可以检索有关最新奥斯卡的最新信息,并在此上进一步加工,将浏览转变为新型附加体验的方式。
1.2 Code Interpreter(代码编程器):开发工具中的“方天画戟”
OpenAI推出的代码编程器,帮助解决定量和定性等数学问题、进行数据分析和可视化、在格式之间转换文件。具体而言,OpenAI在沙盒化、防火墙的执行环境中为模型提供工作的Python编程器,以及一些临时的磁盘空间。由解释器插件运行的代码会在持续会话中进行评估,并且后续调用可以相互构建。目前,该功能支持将文件上传到当前对话工作区并下载工作结果。
代码编程器将极大降低编程壁垒。代码编程器的功能是通过ChatGPT打破编程沟壑,仅通过文字描述即可实现各种功能。如1)让ChatGPT编辑视频——只要给出一个指令,ChatGPT就会对上传视频文件进行处理,具备剪辑、添加等功能;2)在ChatGPT内部的大量开发工作,并无需脱离用户界面,实现直接从其他系统中调用所需代码进行开发工作。
在相关演示视频中,OpenAI主要演示了三部分内容:通过函数来生成与修改图表;解析CSV文件内容,并获取、分析表格数据、生成可视化图表;上传图片,动态调整图片大小、灰度、色调,并生成下载链接。
1.3 Retrieval(检索插件):专属的私人助理
用自己的数据去训练出私人助理。通过Retrieval插件,可将GPT检索内容从海量数据的范围聚焦到个人或企业的范畴,并赋予GPT强大的理解能力。本质上是专属理解个人或企业数据的GPT,或者说,是一个从公司创立之初即伴随的“顶级秘书”。
知识检索(Retrieval)插件在授权允许ChatGPT 访问个人或企业数据的情况下,通过自然语言的方式,对个人或组织的信息资源(如文件、emails 或公共文档等等)进行赋能。知识检索插件主要支持对个人或组织文档进行语义搜索和检索。允许用户通过自然语言提问或表达需求,从自身的数据源(如文件、笔记或电子邮件)中获得最相关的文档片段;使用相关插件,企业可以通过ChatGPT将内部文档整合并持续梳理。
2 不可忽视的战略意义:复制苹果生态的伟大历程
OpenAI正沿着类苹果模式的“终端+平台+生态”,迈向高于操作系统的战略地位。复盘苹果生态圈的构建,苹果率先推出iPhone手机抢占智能手机的制高点;其次,苹果通过发布App Store形成应用平台的统一;依托应用程序工具套件的开发促进生态圈的繁荣发展。最终形成产品、服务和软件应用的闭环,构建出“终端+平台+生态”的苹果模式。
2.1 复制苹果平台生态,追随微软核心战略
引入插件Plugin标志ChatGPT走在创建生态系统的伟大道路上,统一平台+插件的模式有望构建与苹果+App Store相似的繁荣生态。
复盘苹果生态模式发展进程,我们发现ChatGPT已经具备的全部的先决条件
1) 通过ChatGPT划时代的交互方式抢占终端的制高点,对标iPhone 4发布;
2) 发布Plugin并推出“交互+编程+个人助手”三大套件,对标 APP Store模式,打造苹果式的手机体验;
3) 宣布接入海量应用插件,在统一平台上形成功能相互协同=App Store通过排行榜、搜索等方式帮助iPhone用户快速找到想要的应用程序的 “苹果平台”商业模式。
如同微软在Windows尚未成熟之际即推出市场,ChatGPT追随微软核心战略,迅速占领用户使用习惯的制高点。国内外科技巨头纷纷发布AI大模型ChatGPT为开发者提供便捷开发体系,可用自然语言生成插件。ChatGPT插件的开发对代码能力的要求大大降低,可用自然语言对功能描述,即可令ChatGPT生成初版程序,开发者只需要跟随文字描述可以进一步修改程序的功能。此外,ChatGPT还提供了具备联网能力的Browsing、降低编程成本的Code interpreter、具备梳理能力的retrieval等官方插件。参考2008年苹果ios开发工具发布后AppStore应用数量快速提升,在此基础上相较之下,使用苹果的APP开发工具套件仍然需要学习如UIKit、SwiftUI等编程语言,ChatGPT低门槛的开发体系有望带来插件数量更大弹性增长。
在黎明到来之前率先定义阳光的颜色,ChatGPT的插件开发和使用闭环将定义未来用户的使用习惯。客户可以根据自己的需求选择相应的插件,进一步个性化自己的聊天机器人。OpenAI表示“人工智能模型充当智能API调用程序,给定一个API规范和一个关于何时使用该API的自然语言描述,模型会主动调用该API来执行操作。”“例如,如果用户问‘我应该在巴黎的哪里过几夜’,模型可以选择调用酒店预订插件的API,接收API的响应,并结合API数据及其自然语言功能生成一个给用户的答案。”如同微软在1993年放弃DOS,而在windows NT未完全成熟之际推出,将图形化操作方式带给用户,OpenAI在黎明到来之前率先定义阳光的颜色。
2.2 ChatGPT是AI时代的“iPhone”时刻
ChatGPT与iPhone一样起到“颠覆认知,推动产品大规模使用“的功能。据Statista数据,ChatGPT仅花五天时间做到用户数量破亿为历史最快,排名第二的Ins需要2.5个月。究其原因,ChatGPT颠覆了人们对AI智能不如人类智能的传统认知。据SEQUOIA数据,经过1950年至今的AI 研发积累,以GPT3为代表的大模型的AI智能已经超过人类智能,可以完成精英级别的对话、编程、数据分析等工作,给人完全超预期的使用体验。此外,凭借微软和OpenAI的数据标注、数据训练等工作积累,ChatGPT与人类交互效果良好,这进一步推动了ChatGPT的广泛使用。
2.3 Plugin构建加强版的App Store
“ChatGPT+Plugin“不止构建与AppStore类似的C2C商业模式,还拥有API接口强粘性。此前,ChatGPT一直存在数据基于2021年9月之前的痛点,而ChatGPT 引入Plugin,带来OpenAI专门为其开发的两大插件:网络浏览器和代码解析器。从而实现ChatGPT 的联网能力,通过将插件当做桥梁去获取互联网上的最新数据;并通过代码解析器实现用代码去解决基本逻辑问题,进行数据分析,以及格式转换等。ChatGPT在不断的探索中已经拥有成为C2C平台的基础,在ChatGPT自身具备iPhone的核心终端角色下,通过Plugin与全球应用形成强绑定,实现了强于App Store的伟大演进。
2.4 海量应用插件将于同一平台上相互协同,构建高于操作系统的战略地位
ChatGPT自身的三大套件是构建海量插件相互协同的核心抓手,其目的是通过将多插件形成对用户的全方位覆盖,最终形成专属个人的AI管家。从ChatGPT的首批接入的插件厂商即可看出OpenAI的目标是覆盖人类生活的全维度:
1) KAYAK与Expedia作为美国前列的旅游订票网站,其内容包含酒店、租车、机票等日常出行内容;
2) Klarna Shopping、Instacart与OpenTable分别用于日常购物、超市选购和餐厅预定方面;
3) FiscalNote、speak、Zaiper以及Wolfram等用于日常乃至专业的法律咨询。
通过调节和协作以上插件,ChatGPT从本质上转变为每个人的私人助理。当个人可以通过同一平台同时安排衣食住行、工作、娱乐乃至教育的任务部署,将构建不可打破的高粘性,并反哺于GPT模型的优化,最终进一步扩展ChatGPT-PlugIn的战略宏图。
3 从国内多维度视角看ChatGPT迈向操作系统的关键信号
ChatGPT-PlugIn通过多款插件对多行业全方位覆盖,国内对标公司也受益于此次技术革新,在统一平台部署各类应用,强化客户粘性。在ChatGPT通过Plugin开启迈向迈向操作系统的关键信号,映射至国内具备稀缺性的三六零、寒武纪以及同花顺。
而我们进一步梳理首批插件的国内对标公司,其中石基信息面向酒店及出行预定以及订餐;科大讯飞、金桥信息涉及的法律咨询领域;中科创达作为无代码集成平台的映射标的。
3.1 三六零:AI平台“微软模式”践行者
三六零的新搜索对标微软的New bing,具备颠覆搜索引擎的动力与实力。AI赋能C、SME和B&G端,全面布局类GPT应用。三六零是互联网算法领域的龙头,安全业务、互联网业务和智能硬件业务是公司三大核心业务。随着全球巨头以ChatGPT为核心在AI领域的注资布局,三六零也加大研发投入,近期计划推出一系列类GPT的应用产品,同时布局C端、SME端、G端以及B端。
1)ToC端,公司将借鉴微软New Bing模式,推出新一代生成式AI搜索引擎、AI浏览器、AI个人助理等产品;
2)ToSME端,公司将推出生成式AI办公套件、AI企业即时通信工具等SaaS化垂直应用,如结合生成式AI的即时通讯工具“推推”、“苏打办公套件”等;
3)ToG&B端,公司将国内最完整的安全大数据以及最强大的安全专家能力赋能给360安全AI,计划结合数字安全业务推出企业私有化AI服务。
三六零的AI开放平台对标微软旗下的ChatGPT-PlugIn生态,为第三方开发者提供接入平台。三六零应用开放平台依托三六零庞大的用户群体、海量优势资源,基于用户上网需求的变化,为第三方开发者和合作伙伴提供互联网应用接入平台。合作伙伴可以将应用提交到360应用开放平台,获得360桌面、360网址导航、360应用中心等三大应用入口,集成了来自生活、健康、游戏、视频、小说、新闻资讯、音乐、购物、娱乐等多领域的互联网应用,有利于三六零争夺平台消费者,扩大平台融合力和影响力,让用户得到更多的应用机会和体验。
风险提示:行业竞争加剧,AI平台开发不及预期。
3.2 寒武纪:推理芯片对标英伟达,推理平台领先
公司全面布局AI软硬件产品,其中思元370X8带宽超600GB/s,性能对标英伟达A100,推理平台支持各类主流模型。据公司2022年中报,公司MLU370-X8 搭载双芯片四芯粒思元370,集成寒武纪 MLU-Link™多芯互联技术,主要面向训练任务,在业界应用广泛的YOLOv3、Transformer等训练任务中,8卡计算系统的并行性能平均达到350W RTX GPU的155%。
公司持续完善推理加速引擎 MagicMind 及其周边生态:功能上,MagicMind 持续增加分通道量化、权值热更新等基础特性,算子支持数扩充超过 200 个,公开 Benchmark 模型和非公开私有模型支持数量持续增加,最新版本已全面支持图像分类、视频理解、语义分割、相似度检测、文本检测、OCR、语音处理、自然语言处理、搜索、推荐等多领域的云边端推理业务。模型部署优化上,支持了 QAT 模型直接部署。性能上,MagicMind 持续优化内部实现,在上述多个领域的典型模型上,均取得不弱于同规格友商产品的性能表现。
公司持续推进通用性训练软件栈的研发和改进工作:功能上,Pytorch 增加了新版本的支持,算子覆盖度达到 70%,Tensorflow 的算子数量及交付网络模型均有所增加;加强了对 PaddlePaddle的支持,分布式训练框架 Horovod 增加了对 XLA 的支持,支持 MoE 模型分布式训练。最新版本软件栈已全面支持图像分类、视频理解、语义分割、相似度检测、文本检测、OCR、语音处理、自然语言处理、搜索、推荐等多领域的训练业务。
3.3 同花顺:被低估的金融ChatGPT入口
在AI领域深度布局。2009年,同花顺开始布局人工智能领域,成立新部门“i问财”,定位为金融垂直搜索引擎,专门为股民提供专业的股票信息搜索服务。2012年,问答功能上线,可以直接给用户想要的答案;并从金融垂直领域拓展出更多领域。2015年,同花顺自主研发的“语音识别技术”,在语音识别领域处于第一梯队。2017年,同花顺上线AI开放平台,并推出智能投顾、知识图谱、智能语音技术、自然语言基础服务、智能金融问答等多项产品服务。
i问财是同花顺旗下的专业智能投研、投顾服务平台,是财经领域落地成功的自然语言、语音问答系统。i问财投研平台提供了多维度的股票、基金、债券数据,投资者输入自然语言问句就能搜索想要的数据和信息。此外还有条件选股、研报图表、精选策略、产品搜索、短线复盘、策略回测、宏观经济等功能。旨在通过人工智能、大数据分析技术帮助用户精准分析,提高股票诊选能力。
风险提示
政策落地不及预期;行业竞争加剧。
1)政策落地不及预期:目前国产软硬件在产品性能和生态上都尚且不及国外巨头,但受益于国产化政策推动市场份额连年提升,若后续国产化支持政策落地进度不及预期,可能会导致国产软硬件推进进度变慢,影响公司业绩增长前景。
2)行业竞争加剧:目前国产软硬件尚未呈现出清晰的格局,芯片、数据库、操作系统等行业仍处于高度竞争状态,若后续行业竞争加剧,可能会影响公司的毛利率水平,进而影响相关公司的盈利能力。
计算机团队介绍
吕伟:民生证券计算机行业首席分析师,北京大学理学硕士,2021年加入民生证券研究所。
分析师承诺
本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并登记为注册分析师,基于认真审慎的工作态度、专业严谨的研究方法与分析逻辑得出研究结论,独立、客观地出具本报告,并对本报告的内容和观点负责。本报告清晰准确地反映了研究人员的研究观点,结论不受任何第三方的授意、影响,研究人员不曾因、不因、也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。
免责声明
民生证券股份有限公司(以下简称“本公司”)具有中国证监会许可的证券投资咨询业务资格。
本报告仅供本公司境内客户使用。本公司不会因接收人收到本报告而视其为客户。本报告仅为参考之用,并不构成对客户的投资建议,不应被视为买卖任何证券、金融工具的要约或要约邀请。本报告所包含的观点及建议并未考虑个别客户的特殊状况、目标或需要,客户应当充分考虑自身特定状况,不应单纯依靠本报告所载的内容而取代个人的独立判断。在任何情况下,本公司不对任何人因使用本报告中的任何内容而导致的任何可能的损失负任何责任。
本报告是基于已公开信息撰写,但本公司不保证该等信息的准确性或完整性。本报告所载的资料、意见及预测仅反映本公司于发布本报告当日的判断,且预测方法及结果存在一定程度局限性。在不同时期,本公司可发出与本报告所刊载的意见、预测不一致的报告,但本公司没有义务和责任及时更新本报告所涉及的内容并通知客户。
在法律允许的情况下,本公司及其附属机构可能持有报告中提及的公司所发行证券的头寸并进行交易,也可能为这些公司提供或正在争取提供投资银行、财务顾问、咨询服务等相关服务,本公司的员工可能担任本报告所提及的公司的董事。客户应充分考虑可能存在的利益冲突,勿将本报告作为投资决策的唯一参考依据。
若本公司以外的金融机构发送本报告,则由该金融机构独自为此发送行为负责。该机构的客户应联系该机构以交易本报告提及的证券或要求获悉更详细的信息。本报告不构成本公司向发送本报告金融机构之客户提供的投资建议。本公司不会因任何机构或个人从其他机构获得本报告而将其视为本公司客户。
本报告的版权仅归本公司所有,未经书面许可,任何机构或个人不得以任何形式、任何目的进行翻版、转载、发表、篡改或引用。所有在本报告中使用的商标、服务标识及标记,除非另有说明,均为本公司的商标、服务标识及标记。本公司版权所有并保留一切权利。
民生证券研究院:
上海:上海市浦东新区浦明路8号财富金融广场1幢5F;200120
北京:北京市东城区建国门内大街28号民生金融中心A座18层;100005
深圳:广东省深圳市深南东路5016号京基一百大厦A座6701-01单元;518001