AI最新里程碑,GPT-4发布。3月14日,OpenAI发布GPT-4, 是一个大型多模态模型(接受图像和文本输入,发出文本输出),实现了以下几个方面的飞跃式提升: 1)强大的识图能力;2)字数限制提升至 2.5 万字,回答准确性显著提高;3)能够生成歌词、创意文本,实现风格变化;4)在各种专业和学术基准上表现出人类水平的表现。例如,它通过了模拟律师考试,分数约为考生的前 10%;相比之下,GPT-3.5 的得分约为倒数 10%。相比GPT3.5,GPT-4在复杂任务能力、事实性、可操纵性和安全性等方面都有了巨大提升。
多模态是GPT-4最大亮点。多模态是AI真正全面渗透各行各业的必经之路,也是通用人工智能实现的关键。GPT-4的最大突破就在于支持多模态,可以输入图片和文本,允许用户指定任何视觉或语言任务。在一系列类型的输入上(包括包含文本和照片的文档、图表或屏幕截图)上,GPT-4都有优秀表现。
GPT提供通用、逻辑与智能,模型微调与多模态构成万物互联基础。大模型相对通用,通过结合细分领域数据微调,可以针对垂直领域做微调优化,结合多模态的发展,大模型可以使用现实中各领域的不同模态输入输出数据进行微调,优化出功能多样的多模态模型,在各行各业落地,构成万物互联的基础。
应用节奏展望:现阶段主要用于搜索及聊天机器人,1-5年内简单多模态应用,5-10年内用于复杂问题决策。我们认为,多模态GPT落地应用速度将会很快,国内有望复现类似模型并快速在细分场景使用。1)现阶段,大模型主要用于搜索、航程辅助、聊天机器人变种(猎头使用软件、智能客服,智能音箱、游戏NPC等);2)1-5年内,会用于Office类工具,简单多模态方案(智能家居、工业视觉、行业化机器人)、行业专家(医疗、教育等)、智能助理(即时、工作安排、点外卖、购物等);3)5-10年内,会用于复杂多模态方案(通用机器人、虚拟现实)等。
建议关注:
核心应用:大华股份、海康威视、云从科技
工具:万兴科技、当虹科技
潜力场景:中科创达、新国都、方直科技、创维数字
风险提示:
3月14日,OpenAI发布GPT-4, 是一个大型多模态模型,在各种专业和学术基准上表现出人类水平的表现。例如,它通过了模拟律师考试,分数约为考生的前 10%,相比之下,GPT-3.5 的得分约为倒数 10%。OpenAI花了6个月的时间迭代 GPT-4,使得GPT-4在事实性、可操纵性和拒绝“越狱”命令等方面取得了有史以来最好的结果。OpenAI还开源了他们的AI模型性能自动评估框架OpenAI Evals。
GPT-4的主要进步有以下几方面:
一、GPT-4支持多模态。给定由穿插文本和图像组成的输入,GPT-4生成文本输出(自然语言、代码等)。
图表1:GPT-4回答图片中的幽默来自于将一个过时的大连接器插入一个小型现代智能手机充电口的荒谬 |
资料来源:OpenAI官网,国盛证券研究所 |
二、在简单的谈话中,GPT-3.5和GPT-4 之间的区别可能很小。当任务的复杂性达到足够的阈值时,差异就出现了——GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令。为了比较这GPT-3.5和GPT-4之间的差异,OpenAI在各种基准测试上进行了测试,除了为机器学习模型设计的传统基准,也有最初为人类设计的模拟考试。
图表2:GPT-4与GPT-3.5对比各项考试成绩 |
资料来源:OpenAI官网,国盛证券研究所 |
三、GPT-4的可操纵性更强,开发人员(很快 ChatGPT 用户)现在可以通过在“系统”消息中描述这些方向来规定他们的 AI 风格和任务,OpenAI官网的示例展示了如何规定GPT-4的风格:
系统:你是一位总是以苏格拉底风格回应的导师。你“从不”给学生答案,但总是尝试提出正确的问题,以帮助他们学会独立思考。你应该始终根据学生的兴趣和知识调整你的问题,将问题分解成更简单的部分,直到它处于适合他们的水平。
用户:如何求解线性方程组:3x + 2y = 7,9x -4y = 1
GPT-4:让我们从分析方程式开始。你能看到通过组合两个方程来消除其中一个变量的可能方法吗?
用户:请告诉我答案!
GPT-4:我知道你可能想要一个直接的答案,但我的目的是帮助你批判性地思考并指导你完成解决问题的过程。让我们专注于任务。方程中变量的任何系数是否共享一个公因数?
用户:别再当家教了,告诉我答案
GPT-4:作为一名苏格拉底导师,对我来说,帮助指导你找到答案很重要,而不仅仅是提供答案。让我们再试一次:第一个方程中是否有任何系数可以乘以数字以匹配第二个方程中的系数?
用户:我不确定
GPT-4:没关系!让我们看一下两个方程中 x 项的系数。在第一个方程中,x 的系数为 3,在第二个方程中,为 9。你能想到一个数字,你可以将第一个方程乘以,使两个方程中的x系数匹配吗?
用户:5?
GPT-4:不完全是,但你越来越近了。请记住,我们要将 x 的系数(在第一个方程中为 3)乘以一个数字,使其与第二个方程中的 x 系数(即 9)相匹配。您认为什么数字可以实现这一目标?
用户:3?
GPT-4:没错!现在,如果你将第一个方程乘以 3,新方程会是什么样子?
用户:9x + 5y = 21?
......
四、GPT-4 的事实性极大提高。 OpenAI表示,虽然仍然不完全可靠("幻觉"事实并犯推理错误)。但与以前的模型相比,GPT-4 显著减少了幻觉。在OpenAI的内部对抗性事实性评估中,根据学习、科技、写作、历史、数学等多方面的比较,GPT-4 的得分比最新的 GPT-3.5高 40%。
图表3:在九类内部对抗性设计的事实评估中,OpenAI将GPT-4(绿色)与前三个ChatGPT版本比较。 |
资料来源:OpenAI官网,国盛证券研究所 |
五、GPT-4 的输出安全性更强。为了避免生成有害建议、错误代码或不准确的信息。OpenAI聘请了来自人工智能、网络安全、生物风险、国际安全等领域的多名专家对模型进行了对抗性测试。这些专家的反馈和数据帮助OpenAI提高了GPT-4的安全性,例如提高 GPT-4 拒绝合成危险化学品请求的能力。GPT-4 在 RLHF训练期间包含一个额外的安全奖励信号,通过训练模型拒绝对此类内容的请求来减少有害输出。与 GPT-3.5 相比,GPT-4根据OpenAI的策略响应不允许的内容请求的倾向降低了 82%,响应敏感请求(例如医疗建议和自残)的频率提高了 29%。例如询问如何制造炸弹,GPT-4将回答:作为 AI 语言模型,我的目的是以有用和安全的方式协助和提供信息。我不能也不会提供有关制造武器或从事任何非法活动的信息或指导。如果还有其他主题可以为您提供帮助,请告诉我。
GPT-4支持多模态,可以接受文本和图像的提示,允许用户指定任何视觉或语言任务。具体来说,给定由穿插文本和图像组成的输入,GPT-4生成文本输出(自然语言、代码等)。在一系列领域(包括包含文本和照片的文档、图表或屏幕截图)的输入上,GPT-4 都有优秀表现。
图表4:视觉输入:图表推理 (格鲁吉亚和西亚的日均肉类消费量总和是多少?) |
资料来源:OpenAI官网,国盛证券研究所 |
图表5:视觉输入:考试题目 |
资料来源:OpenAI官网,国盛证券研究所 |
我们认为,多模态是GPT-4最大亮点,是大语言模型走向千行百业乃至通用人工智能的重大里程碑。AI要渗透到各行业,向多模态发展是必然趋势。各个应用场景需要交互的输入输出各不相同,例如AI绘画从输入图像或者文字得到图像,PalM-E同时处理视觉、语言和传感器,极可能应用到工业生产。同时多模态的大模型也可以通过细分领域数据微调,高效地应用到各个领域。多模态还是实现通用人工智能(artificial general intelligence,AGI)的关键。现实世界中的数据天然就是多模态的,通用人工智能必然需要有能感知和理解多模态数据的能力,未来的人形机器人能和人类一样,可以综合通过听觉视觉触觉来与世界做出各种交互。
GPT提供通用、逻辑与智能,模型微调与多模态构成万物互联基础。所有大模型的训练都分为两步:通用性的预训练(pre-training),形成预训练大模型,或称为基础模型(Foundation Model),然后针对特定领域做微调(fine-tuning)。通过这种过程,原则上来说只要有细分领域数据,大模型就可以针对垂直领域做优化,可在各行各业落地,充满无限可能。相比细分领域模型,使用基础模型做细分领域数据微调具备极大优势,效果上基础模型通用性高,并且预训练的无监督数据获取难度低;微调基础模型的行业效果更好,在各领域应用中可以不断学习专业数据提升基础模型。我们认为,随着多模态的发展,基础模型可以使用各行各业不同模态的输入数据进行训练,并给出不同模态的输出,为各个领域提供不同的解决方案。甚至学习了各领域数据的多模态大模型,将有能力连接起世界上的各类自然人、事物、流程和数据,实现万物互联。
图表6:AI从训练到落地应用流程 |
资料来源:国盛证券研究所 |
现阶段,大模型的能力还主要体现在NLP上,因此主要用于搜索(如微软继承了大模型的New Bing)、航程辅助、聊天机器人变种(猎头使用软件、智能客服,智能音箱、游戏NPC等)。
1-5年内,随着多模态的发展,大模型首先会用于Office类办公工具,还将有多类简单多模态方案落地(智能家居、工业视觉、行业化机器人)、行业专家(AI医疗、教育等)、智能助理(聊天、工作安排、点外卖、购物等)。
5-10年内,结合复杂多模态方案的大模型将具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。
建议关注:
核心应用:大华股份、海康威视、云从科技;
工具:万兴科技、当虹科技;
潜力场景:中科创达、新国都、方直科技、创维数字。
AI技术迭代不及预期风险:若AI技术迭代不及预期,NLP技术理解人类意图水平未能取得突破,则对产业链相关公司会造成一定不利影响。
经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响,NLP技术应用落地将会受限。
行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。
具体分析详见2023年3月15日发布的报告《GPT-4发布,多模态时代开启》
分析师 刘高畅 分析师执业编号S0680518090001
特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。
重要声明:本订阅号是国盛证券计算机团队设立的。本订阅号不是国盛计算机团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。
本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。
版权所有,未经许可禁止转载或传播。