ChatGPT表现惊艳,网站流量一路狂飙式成长。根据数据统计机构Similarweb的估计,chat.openai.com网站(即ChatGPT官网)在2023/1/27-2023/2/3这一周吸引的每日访客数量高达约2500万,在1月31日的流量高峰日,该网站吸引了2800万次访问。并且在1/3-2/3这一个月里,该网站的流量平均每天增长3.4%,增速惊人。
从Transformer到ChatGPT,有哪些历史性突破?ChatGPT用户数高速增长的根本原因,来源于其突破性的表现,其中最突出的有两点体现:1)ChatGPT与人类“对齐”了偏好,其应答更适应人类习惯,并且能驳回一些反道德的提问,展现出显著优于前代的智能度。2)ChatGPT具备了思维链(Chain-of-Thought,CoT)能力,能够处理一定程度的复杂思维逻辑。3)ChatGPT在算数、国际音标转写、单词解读、问答、事实性问答、基础概念映射、多任务自然语义理解、上下文单词理解等8个指标上表现出全面综合的能力。
量变到质变,规模超过特定阈值后模型性能陡增。根据谷歌发布的论文《Emergent Abilities of Large Language Models》,可以看到多个NLP任务随着模型规模扩大的性能变化曲线:前期性能和模型规模大致呈线性关系;然而当模型规模大到一定程度时,任务性能有了明显的“飞升”。
海量代码训练,模型习得代码背后隐含的逻辑能力。根据熵简科技介绍,“代码”可以理解为一种具备高度逻辑性的文本语料,不具备强逻辑性的代码会无法执行,而不像普通文本语料那样有着较高的逻辑自由度。模型从对大量代码的学习过程中,逐渐掌握了隐藏在代码背后的抽象能力与逻辑能力,进而涌现出我们在ChatGPT上感受到的“智能”。
训练过程加入了人类反馈,模型偏好向人类看齐。通过有人类反馈的加强学习(RLHF)训练,人类手动对AI给出的回复进行排名,让AI模型理解人类偏好。由于训练过程中加入了人类反馈,有别于前代GPT-3单纯使用海量数据的训练方法,ChatGPT能够更好地理解用户指令,并作出反应。
投资建议。建议关注:1)应用型公司:金山办公、光云科技、当虹科技、云赛智联、同花顺、万兴科技、立方数科、神思电子、宇信科技、360、高伟达、寺库、知乎、汉王科技等;2)算力公司:浪潮信息、中科曙光、海光信息、寒武纪、景嘉微、世纪华通、光通信产业链公司;3)相关技术公司:科大讯飞、云从科技、拓尔思、海天瑞声、海康威视、萤石网络、百度、阿里、腾讯;4)软件开发效率提升:赛意信息、润和软件、法本信息、游戏公司等;5)机器人:三花智控、鸣志电器、绿的谐波、晶品特装、微创机器人等。
ChatGPT流量以每日3.4%的速度快速成长,每日用户数已超2500万。根据数据统计机构Similarweb的估计,chat.openai.com网站(即ChatGPT官网)在2023/1/27-2023/2/3这一周吸引的每日访客数量高达约2500万,在1月31日的流量高峰日,该网站吸引了2800万次访问。并且在1/3-2/3这一个月里,该网站的流量平均每天增长3.4%,增速惊人。
2)ChatGPT具备了思维链(Chain-of-Thought,CoT)能力,能够处理一定程度的复杂思维逻辑。对于一些逻辑较为复杂的问题,直接向大规模语言模型提问可能会得到不准确的回答,但是如果以提示(prompt)的方式在输入中给出有逻辑的解题步骤(即将复杂问题拆解为多个子问题解决再从中抽取答案)的示例后再提出问题,大模型就能给出正确题解。有时,甚至不用给示例,在输入后面接一句“Let’s think step by step”,模型的输出就是一步一步“思考”后的各个子问题的结果,再将该输出拼到输入后构造第二次输入数据,大模型就能进一步将上一步的输出整合,得出正确的复杂问题的解。
学界普遍推测,ChatGPT的复杂思维能力(CoT能力)来自于代码训练。根据熵简科技介绍,ChatGPT的背后是Text-davinci-002模型,但如果回溯ChatGPT的“模型家谱”, Text-davinci-002模型其实是基于Code-davinci-002模型经过指令微调的产物。如果进一步回溯到起点,对于没有接受过代码数据训练的GPT-3模型,它的复杂推理能力是很弱的。GPT-3的一个分支对代码数据进行了专项训练,Codex模型中代码数据量约为159G,基于此产生的Code-davinci-002模型神奇的具备了思维推理能力。由于这一能力近来才出现,学界对于它是如何产生的尚无定论,但学界普遍推测:在模型训练的过程中,是否引入“代码数据集”,很有可能是模型是否具备复杂思维能力的关键变量。
代码是一种强逻辑性的文字,模型在学习代码的过程中习得了逻辑能力。“代码”可以理解为一种具备高度逻辑性的文本语料,不具备强逻辑性的代码会无法执行,而不像普通文本语料那样有着较高的逻辑自由度。模型从对大量代码的学习过程中,逐渐掌握了隐藏在代码背后的抽象能力与逻辑能力,进而涌现出我们在ChatGPT上感受到的“智能”。
具体分析详见2023年2月26日发布的报告《ChatGPT技术篇:智能背后的秘密》
分析师 刘高畅 分析师执业编号S0680518090001
特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。
重要声明:本订阅号是国盛证券计算机团队设立的。本订阅号不是国盛计算机团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。
本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。
版权所有,未经许可禁止转载或传播。