基础模型+细分领域微调,GPT可落地千行百业。预训练大模型相对通用,通过结合细分领域数据与KNOW-HOW,大模型可以针对垂直领域做微调优化,在各行各业落地。相比细分领域模型,使用基础模型做细分领域数据微调具备极大优势,效果上基础模型通用性高,并且预训练的无监督数据获取难度低;微调基础模型的行业效果更好,在各领域应用中可以不断学习专业数据提升基础模型。
输入输出信号多模态,是大模型改变物理世界的关键。多模态是AI真正全面渗透各行各业的必经之路,也是通用人工智能实现的关键。即使在单一模态应用上,多模态模型的能力也往往比单模态模型更强。微软,谷歌等大厂相继推出多模态大模型KOSMOS-1和PalM-E562B,微软德国首席技术官透露GPT4或为多模态大模型。展望未来,大模型的输入输出信号会走向多模态,可能是图像、视频甚至机器人决策指令,潜在应用空间更广泛。
产业节奏展望:现阶段主要用于搜索及聊天机器人,1-5年内简单多模态应用,5-10年内用于复杂问题决策。我们认为,多模态GPT落地应用速度将会很快,国内有望复现类似模型并快速在细分场景使用。1)现阶段,大模型主要用于搜索、航程辅助、聊天机器人变种(猎头使用软件、智能客服,智能音箱、游戏NPC等);2)1-5年内,会用于Office类工具,简单多模态方案(智能家居、工业视觉、行业化机器人)、行业专家(医疗、教育等)、智能助理(即时、工作安排、点外卖、购物等);3)5-10年内,会用于复杂多模态方案(通用机器人、虚拟现实)等。
现阶段AI赋能:智能办公最先落地,类聊天机器人应用快速产生。智能办公领域,微软已经宣布将ChatGPT 与其低代码应用平台 Power Platform应用,并且微软首席执行官纳德拉或将于3月16 日举办的在线活动中,展示类似 ChatGPT 的人工智能如何在 Teams、Word 和 Outlook 等 Office 生产力套件中发挥作用。在智能家居领域,ChatGPT有望助力智能家居产品渗透率提升,而其中智能音箱是重要抓手,随着ChatGPT提高智能音箱交互体验,有望使得智能音箱从非刚需产品逐步转型为家庭必备产品。在智能电商领域,智能客服可为商家提升效率。未来随着人形机器人发展,人类将走向通用人工智能时代。
建议关注:
算力及数据公司:中科曙光、海光信息、拓维信息、常山北明、浪潮信息、寒武纪、景嘉微、工业富联、光通信产业链;
核心技术公司:百度、阿里、华为、科大讯飞、360、海天瑞声、云从科技、拓尔思、腾讯、字节跳动等;
应用:1)对标微软办公:金山办公;2)多模态(输入输出信号变化):大华股份、海康威视、当虹科技、万兴科技、新国都、中科创达、泽宇智能。3)互联网传媒:汤姆猫、昆仑万维、立方数科、中文在线、蓝色光标、利欧股份、视觉中国。4)智能音箱:漫步者、国光电器。5)国内巨头合作或场景型公司:光云科技、同花顺、宇信科技、高伟达、方直科技、寺库、知乎、神思电子、汉王科技。6)医疗应用:嘉和美康、卫宁健康、润达医疗、药石科技。7)通过CHATGPT写代码提升效率:赛意信息、润和软件、法本信息等一系列软件公司。8)机器人:三花智控、鸣志电器、绿的谐波、晶品特装。
风险提示:
所有大模型的训练都分为两步:通用性的预训练(pre-training),形成预训练大模型,或称为基础模型(Foundation Model),然后针对特定领域做微调(fine-tuning)。通过这种过程,原则上来说只要有细分领域数据,大模型就可以针对垂直领域做优化,可在各行各业落地,充满无限可能。基于预训练大语言模型GPT3.5加入监督数据微调得到的ChatGPT,在对话、写作等多方面的优秀表现,掀起了预训练大模型的浪潮。目前,OpenAI已经向用户提供上传数据微调模型的付费服务。
图表1:AI从训练到落地应用流程 |
资料来源:国盛证券研究所 |
图表2:OpenAI微调模型价格表 |
资料来源:OpenAI官网,国盛证券研究所 |
相比细分领域模型,使用基础模型做细分领域数据微调具备成本和效果两方面的优势。
1)成本优势主要可以模型搭建成本以及数据获取成本两方面考虑。一方面如果每个细分领域完成不同的任务都需要从头搭建和训练一个模型,而使用预训练的基础模型做微调,在规模效应下会显著降低模型的落地成本。一方面基础模型可以大量使用获取成本较低的公开数据、无监督数据用于预训练,学习海量数据中的知识和逻辑,在微调时只需要少量获取成本较高的细分领域高质量标注数据。另外,拥有基础模型的厂商,在对接众多下游应用的过程中,也会积累工程上的经验,形成日益完备的解决方案。
2)效果优势也可以从当前大模型的效果和未来提升空间两方面考虑。首先预训练基础模型+专业数据微调往往能表现地比单一领域训练的数据效果更好,这点在ChatGPT上就能体现,之前NLP各领域有不同模型,而现在ChatGPT在对话、翻译、写作甚至写代码等任务上都表现出了更好效果。其次基础模型相对单一领域模型,能力提升空间更大,如果一个厂商推出的基础模型效果好,在使用细分领域数据微调做细分应用时,获取的数据可以反哺自己的基础模型,不断提升自己的基础模型能力,而基础模型的能力越强,便越会加速应用到更多领域,产生正向循环。
众多科技巨头争相推出多模态模型。2月27日,微软推出KOSMOS-1模型,能够感知图片、文字等不同模态输入,并学习上下文,根据给出的指令生成回答。3月6日,谷歌推出palm-E模型,以将真实世界的连续传感器模态直接结合到语言模型中,输入是多模态语句,交织了视觉、连续状态估计和文本输入编码,可以执行多种具体任务,包括机器人操作规划、视觉问题解答等。并具备能与数据集中不存在的物体交互的泛化能力。GPT4将是多模态模型,德国媒体Heise报道称。3月9日,微软德国首席技术官Andreas Braun在活动中透露,GPT4或将在下周推出,并且将是一个多模态模型,会提供完全不同的可能性—例如支持视频。此外,之前DALLE2、Stable diffusion等多模态AI绘画模型在AIGC领域也有出色表现。我们相信,伴随着多模态大模型的不断涌现,更多场景的AI应用将会加速落地。
图表3:KOSMOS-1可接受多模态输入,学习上下文信息进行推理和回答 |
资料来源:微软论文,国盛证券研究所 |
图表4:PaLM-E操控机器人将绿色块推到海龟,机器人之前没见过海龟 |
资料来源:PaLM-E网站,国盛证券研究所 |
AI要渗透到各行业,向多模态发展是必然趋势。各个应用场景需要交互的输入输出各不相同,例如AI绘画从输入图像或者文字得到图像,PalM-E同时处理视觉、语言和传感器,极可能应用到工业生产。同时多模态的大模型也可以通过细分领域数据微调,高效地应用到各个领域。
多模态还是实现通用人工智能(artificial general intelligence,AGI)的关键。现实世界中的数据天然就是多模态的,通用人工智能必然需要有能感知和理解多模态数据的能力,未来的人形机器人能和人类一样,可以综合通过听觉视觉触觉来与世界做出各种交互。
我们认为,模型学习不同模态的数据,可以相互促进不同模态的理解能力,使得多模态模型比单一模态效果更好。微软的论文中在图像分类等任务上测试KOSMOS-1和一些单模态模型对比得到了更好的效果。这个观点还可以从ChatGPT的能力来源上做推理,首先ChatGPT通过学习有强逻辑性的代码数据,得到了对话中更强的推理能力,其实可以认为代码和自然语言就是不同的模态,其次从更狭义的角度来讲,我们可以认为不同语言就是不同模态,ChatGPT只学习了非常少量的中文,但是已经可以在中文对话上得到很好效果,这是因为其他语言中也包含了对话的逻辑,ChatGPT在学到其他语言中的逻辑后,可以运用到中文上。我们认为这种跨语言的学习能力,在跨模态上也能体现。
现阶段,大模型的能力还主要体现在NLP上,因此主要用于搜索(如微软继承了大模型的New Bing)、航程辅助、聊天机器人变种(猎头使用软件、智能客股,智能音箱、游戏NPC等)。
1-5年内,随着多模态的发展,大模型首先会用于Office类办公工具,还将有多类简单多模态方案落地(智能家居、工业视觉、行业化机器人)、行业专家(AI医疗、教育等)、智能助理(聊天、工作安排、点外卖、购物等)。
5-10年内,结合复杂多模态方案的大模型将具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。
大模型能落地的具体应用场景十分广泛,包括并不限于以下场景:
4.1 AI办公:落地最快的领域之一,AI赋能智能办公
AI办公是大模型最快落地的领域之一。据机器之心消息:3月7日,微软宣布将ChatGPT的技术扩展到其Power Platform平台上,这将允许用户在很少甚至不需要编写代码的情况下,就能开发自己的应用程序。另外微软将于3月16日举办一场名为“The Future of Work with AI”的在线活动,首席执行官纳德拉或将展示类似 ChatGPT 的人工智能如何在 Teams、Word 和 Outlook 等 Office 生产力套件中发挥作用。在国内,2021年07月22日,金山办公在珠海举办首届技术开放日,分享了WPS的AI中台能力,并同步发布KSAI-lite 开源框架,将办公领域的先进AI技术向业界开放。
图表5:微软宣传语“Give the power of AI to everyone” |
4.2 智能家居:AI赋能智能家居,AI音箱率先受益
AI技术进步有望助力智能家居产品渗透率提升,而其中智能音箱是重要抓手。当前,智能音箱已完成初轮用户普及,成为智能物联重要端口。ChatGPT推动智能音箱体验升级,有望使智能音箱从非刚需产品逐步转型为家庭必备产品。交互能力更强的ChatGPT有利于提升智能音箱反馈丰富程度以及准确性,对于用户意图的理解更加智能,从而改善用户的使用体验。目前已经有工程师尝试用ChatGPT改变智能家居体验,高级Web开发人员Mate Marschalko利用ChatGPT结合Siri Shortcuts制作更智能的语音助手。Mate Marschalko通过语言发出命令“我正在昏暗的办公室中录制视频,你能帮我做些什么吗?”,ChatGPT语音助手回答“为你打开灯。”,并进行了开灯操作。同时,ChatGPT+智能音箱能够提供情感陪伴,其强大的上文关联能力以及学习能力,使得智能音箱可以根据用户的个人喜好和使用习惯,提供个性化的建议和服务,延伸至情感陪伴功能。
图表6:利用ChatGPT结合Siri Shortcuts制作语音助手 |
资料来源:Mate Marschalko Youtube账号、国盛证券研究所 |
4.3 AI电商:大模型赋能电商环节,智能客服提升效率
大模型有望为光云科技等电商企业赋能,助力智能客服。光云科技为阿里系电商SaaS服务商,目前旗下拥有以超级店长、快递助手、旺店系列为核心的中小商家电商SaaS产品。光云科技已经推出了专为电商打造的客服机器人快麦小智。展望未来,若阿里推出类ChatGPT模型,有望赋能光云科技,提升智能电商客服的能力。
图表7:光云科技为阿里系SaaS公司 |
资料来源:光云科技官网、国盛证券研究所 |
4.4人形机器人: 迈向通用人工智能时代
特斯拉Optimus人形机器人原型机已于2022年10月发布,并在上海进博会上首次面向公众展出,已经能基本实现直立行走、挥手、给植物浇水、搬运盒子等算法功能,平衡性及移动速度大幅提高仅用时4个月,软件迭代高效。ChatGPT有望助力人机互动能力升级,多模态的发展也将助力机器人交互现实世界的能力,相信随着大模型能力提升以及硬件发展,未来人形机器人彻底改变整个人类社会的生产生活方式。
图表8:上海进博会现场展示的特斯拉人形机器人 |
资料来源:IT之家,国盛证券研究所 |
建议关注:
算力及数据公司:中科曙光、海光信息、拓维信息、常山北明、浪潮信息、寒武纪、景嘉微、工业富联、光通信产业链;
核心技术公司:百度、阿里、华为、科大讯飞、360、海天瑞声、云从科技、拓尔思、腾讯、字节跳动等;
应用:
1)对标微软办公:金山办公;
2)多模态(输入输出信号变化):大华股份、海康威视、当虹科技、万兴科技、新国都、中科创达、泽宇智能。
3)互联网传媒:汤姆猫、昆仑万维、立方数科、中文在线、蓝色光标、利欧股份、视觉中国。
4)智能音箱:漫步者、国光电器。
5)国内巨头合作或场景型公司:光云科技、同花顺、宇信科技、高伟达、方直科技、寺库、知乎、神思电子、汉王科技。
6)医疗应用:嘉和美康、卫宁健康、润达医疗、药石科技。
7)通过CHATGPT写代码提升效率:赛意信息、润和软件、法本信息等一系列软件公司。8)机器人:三花智控、鸣志电器、绿的谐波、晶品特装。
AI技术迭代不及预期风险:若AI技术迭代不及预期,NLP技术理解人类意图水平未能取得突破,则对产业链相关公司会造成一定不利影响。
经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响,NLP技术应用落地将会受限。
行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。
具体分析详见2023年3月12日发布的报告《ChatGPT第三次应用展望》
分析师 刘高畅 分析师执业编号S0680518090001
特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。
重要声明:本订阅号是国盛证券计算机团队设立的。本订阅号不是国盛计算机团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。
本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。
版权所有,未经许可禁止转载或传播。