中金研究
3月22日,英伟达召开GTC 2023大会,展示了公司在ChatGPT、半导体光刻、元宇宙、量子计算、智能驾驶等多领域的软硬件布局,发布及更新了包括H100 NVL GPU(适用于ChatGPT大模型部署)、PCIe H100等硬件,以及AI超级计算服务DGX Cloud、光刻计算库CuLitho、GPU加速量子计算系统等多个具备行业代表意义的产品。通过GTC 2023,我们看到:1)公司预计ChatGPT对算力需求有望快速提升,英伟达前瞻布局GPU推理平台,结合公司在训练领域的优势地位,底层硬件架构的迭代升级或将进一步加速;2)硬件厂商的AIGC软硬结合生态初显雏形,公司预计NVIDIA DGX Cloud有望通过云端服务加速强算力硬件及AI应用软件向下游商业公司渗透。我们认为,在ChatGPT持续渗透的背景下,高性能计算硬件与AIGC应用将逐渐形成飞轮效应,国内相关产业链公司也将有望在产业转型变革过程中深度参与。
Abstract
摘要
ChatGPT加速AI产业升级转型,英伟达训练与推理领域齐布局。我们认为GPT模型作为内存和计算密集型模型,对于训练及推理类任务均具备较高的需求。此次GTC上,英伟达推出了专用于训练大型语言模型(LLM)的H100 NVL GPU,可处理拥有1750亿参数的GPT-3大模型,协助LLM处理成本加速下降,同时也以L4/L40产品更新了推理产品线,进一步夯实英伟达在GPT模型训练及推理领域的龙头地位;此外,英伟达再次提及针对加速云数据中心的Grace CPU,并认为该产品未来有望在提高带宽的同时降低功耗,适配ChatGPT的推理工作负载。我们看到英伟达作为行业龙头正积极布局训练+推理的AI算力底座;同时ChatGPT的渗透也正推动AI产业加速转型升级。
不止于硬件,DGX Cloud AI超级计算服务打造多样化AIGC算力提供形式。在本届GTC上,英伟达推出了DGX Cloud,即通过浏览器就可协助企业快速访问训练高级模型所需要的基础设施和软件。公司在GTC 2023上公开指出,计划在未来以月租3.7万美元的形式开放DGX Cloud实例(每个实例均集成了8个H100或A100 80GB GPU),通过软件收费模式提供强大的算力基础。我们认为DGX Cloud通过云服务的方式展现了硬件厂商在未来AIGC普及时代下软硬结合商业模式的雏形,同时该业务的推出或将进一步加快超强算力与AI应用库向下游商业公司的渗透速率。
风险
AIGC落地不及预期,宏观经济不振影响终端需求。
Text
正文
ChatGPT引领AI行业变革,英伟达全面赋能底层硬件
此次GTC 2023,英伟达展示了其针对训练、推理、云服务等多维度的ChatGPT领域布局。我们认为,GPT大模型需要对海量的预料信息进行训练,并借助更高级别的硬件进行支持,算力基础设施建设将成为未来产业公司的重要竞争壁垒之一。我们对于GTC 2023及相关产品发展历程进行梳理总结,以期望给予国内产业链公司借鉴意义:
AI训练:英伟达优势领域,算力持续提升赋能生成式大模型突破。基于GPU并行计算的特性以及英伟达在AI领域的前瞻布局,英伟达在AI训练领域拥有较为优势的行业地位,并持续提升其计算能力。回顾过去,英伟达于2010年发布的GTX 580产品为经典卷积网络模型AlexNet提供算力支持,算力约262 PetaFLOPS;至2020年,训练GPT-3时使用的A100算力芯片,已经可以支持175B的参数处理,算力达323 ZettaFLOPS。
图表1:GPT带来的算力需求升级
资料来源:英伟达官网,中金公司研究部
随着GPT大模型对于算力需求的提升,我们看到科技巨头均已开始或即将搭载英伟达的H100产品:Oracle宣布推出搭载H100 GPU的全新OCI计算裸机GPU产品;Meta已在内部为团队部署了基于H100的Grand Teton AI超级计算机;OpenAI将在其Azure超级计算机上使用H100来为其持续的AI研究提供动力。此次GTC 2023,基于Hopper架构及其内置Transformer Engine,H100针对生成式AI、大型语言模型(LLM)和推荐系统的开发、训练和部署进行了优化,利用FP8精度在LLM上提供较上一代A100更快的训练及推理速度,助力简化AI开发。
图表2:DGX H100 GPU
资料来源:英伟达公司官网,中金公司研究部
图表3:在多专家模型(3950亿个参数)训练过程中H100与A100性能对比
资料来源:英伟达公司官网,中金公司研究部
AI推理:AI视频、图像生成、大型语言模型部署及推荐系统加速部署。在2023GTC中,英伟达推出全新GPU推理平台:基于加速AI视频、图像生成、大型语言模型部署和推荐系统,形成了4种配置(L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超级芯片)、1个体系架构和1个软件栈的产品体系。
图表4:英伟达全新推理平台构成
资料来源:英伟达官网,中金公司研究部
其中H100 NVL GPU受到了较为广泛的关注:英伟达在GTC 2023公开表示,该产品将配备双GPU NVLink(两块94GB HBM3的PCIe H100 GPU),或将实现比现用A100快10倍的速度,可处理拥有1750亿参数的GPT-3大模型,并支持商用PCIe服务器扩展,适用于训练大型语言模型(LLM)。英伟达认为该产品有望显著降低大模型的构建成本。
除H100 NVL GPU,英伟达针对GPT模型,再次提及针对加速云数据中心的Grace CPU,公司指出该产品未来有望在提高带宽的同时降低功耗,适配ChatGPT等新类型的推理工作负载。虽然目前行业仍处在快速搭建算力的阶段,但我们看到英伟达作为行业头部企业,同步布局训练与推理领域,构建硬件层面的全面生态,对中国产业具有借鉴意义。
图表5:NVIDIA Grace Hopper超级芯片逻辑设计
资料来源:英伟达官网,中金公司研究部
云服务:DGX Cloud降低AI超级计算机服务使用门槛。在GTC 2023,英伟达推出DGX Cloud,即通过浏览器就可协助企业快速访问训练高级模型所需要的基础设施和软件。据GTC 2023,英伟达计划在未来以月租3.7万美元的形式开放DGX Cloud实例(每个实例均集成了8个H100或A100 80GB GPU),通过软件收费模式提供强大的算力基础。
据GTC 2023,英伟达目前已经与微软Azure、谷歌OCP、Oracle OCI等多家头部公司进行合作,免除了企业购置、部署和管理本地基础设施的复杂步骤,通过DGX Cloud加速企业为生成式AI和其他应用训练模型的过程。我们认为DGX Cloud通过云服务的方式展现了硬件厂商在未来AIGC普及时代下软硬结合商业模式的雏形,同时该业务的推出或将进一步加快超强算力与AI应用库向下游商业公司的渗透速率。
图表6:英伟达合作的云服务厂商名单
资料来源:英伟达官网,中金公司研究部
基于NVIDIA DGX Cloud提供的强大的算力基础,英伟达与谷歌、微软、Oracle合作开发了一系列应用模型NVIDIA AI Foundations(包括文本生成模型构建服务NVIDIA NeMo、视觉语言模型构建服务NVIDIA Picasso、生命科学服务 NVDIA BioNeMo等)。我们认为,云服务或将成为GPT模型成熟过程中的重要商业模式之一。
图表7:英伟达NVIDIA AI Foundations
资料来源:英伟达官网,中金公司研究部
前沿应用领域持续投入,半导体光刻、元宇宙、量子计算、智能驾驶等多领域齐头并进
半导体光刻:将加速计算引入计算光刻领域,向2nm工艺节点推进。在GTC 2023,英伟达发布了与台积电、ASML和Synopsys合作开发的CuLitho,该产品作为加速光刻基础计算的算法库,英伟达认为或将有助于突破光刻技术的物理极限。根据发布会介绍,CuLitho将在GPU上运作,与在硅片上创建图案的光刻相比,能够有效减少CPU的巨大计算工作量;同时晶圆厂生产过程中可以借助CuLitho提升3-5倍的掩模板生产效率。
图表8:计算光刻原理
资料来源:英伟达官网,GTC Keynote,中金公司研究部
元宇宙:“数字孪生”工业模拟应用Omniverse持续推进研发。英伟达在此次GTC 2023推出Omniverse Cloud,将其作为一种PaaS(Platform as a Service)服务,帮助客户在核心产品的制造业务流程中实现标准数字化。目前,Microsoft Azure是Omniverse Cloud的首家云服务提供商,提供了大规模部署企业服务所需的云基础设施和功能,包括安全、身份和存储;宝马同样宣布将扩大对NVIDIA Omniverse平台的使用,在其全球生产网络中构建和运营工业元宇宙应用程序。通Omniverse,宝马可以将数据聚合到大规模、高性能的模型中,连接其特定领域的软件工具,完全虚拟地规划和优化工厂项目,并实现跨地点、跨设备、多用户实时协作,从而缩短生产时间,提高工厂效率。
图表9:Microsoft Azure为英伟达提供云服务
资料来源:英伟达公司官网,GTC Keynote,中金公司研究部
图表10:宝马虚拟工厂
资料来源:英伟达公司官网,GTC Keynote,中金公司研究部
量子计算:GPU加速量子计算系统DGX Quantum赋能高性能低延迟计算。英伟达在GTC上推出了全球首个GPU加速量子计算系统DGX Quantum,通过将加速计算平台与Quantum Machines的量子控制平台OPX结合,实现GPU和量子处理单元(QPU)之间的亚微秒延迟以及校准、控制、量子纠错和混合算法。同时,DGX Quantum使用了最新的开源CUDA量子软件平台,能够在一个系统中集成和编程QPU、GPU和CPU。
图表11:DGX Quantum合作企业
资料来源:英伟达公司官网,GTC Keynote,中金公司研究部
图表12:NVIDIA Quantum-2性能
资料来源:英伟达公司官网,GTC Keynote,中金公司研究部
智能驾驶:集中式计算平台DRIVE Orin助力汽车安全化发展。近年来,智能汽车快速发展的同时,安全问题也备受关注。英伟达在GTC 2023表示,目前可扩展的DRIVE-Orin平台每秒可执行高达254万亿次的操作,使其能够为人工智能驾驶舱和自动驾驶功能提供动力,同时运行大量深度神经网络,以提供安全性和可靠性。英伟达宣布未来将与比亚迪加强合作,为比亚迪提供支持开发和新软件驱动服务的计算空间,最终将更加安全智能的汽车推向市场。
图表13:DRIVE Orin硬件架构
资料来源:英伟达官网,GTC Keynote,中金公司研究部
Source
文章来源
本文摘自:2023年3月23日已经发布的《全球观察-英伟达GTC 2023:ChatGPT底层硬件迭代加速,AIGC软硬结合生态初显雏形》
黄天擎 联系人 SAC 执证编号:S0080121070283
成乔升 分析员 SAC 执证编号:S0080521060004
唐宗其 分析员 SAC 执证编号:S0080521050014 SFC CE Ref:BRQ161
贾顺鹤 分析员 SAC 执证编号:S0080522060002
彭虎 分析员 SAC 执证编号:S0080521020001 SFC CE Ref:BRE806
Legal Disclaimer
法律声明
特别提示
本公众号不是中国国际金融股份有限公司(下称“中金公司”)研究报告的发布平台。本公众号只是转发中金公司已发布研究报告的部分观点,订阅者若使用本公众号所载资料,有可能会因缺乏对完整报告的了解或缺乏相关的解读而对资料中的关键假设、评级、目标价等内容产生理解上的歧义。订阅者如使用本资料,须寻求专业投资顾问的指导及解读。
本公众号所载信息、意见不构成所述证券或金融工具买卖的出价或征价,评级、目标价、估值、盈利预测等分析判断亦不构成对具体证券或金融工具在具体价位、具体时点、具体市场表现的投资建议。该等信息、意见在任何时候均不构成对任何人的具有针对性的、指导具体投资的操作意见,订阅者应当对本公众号中的信息和意见进行评估,根据自身情况自主做出投资决策并自行承担投资风险。
中金公司对本公众号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。对依据或者使用本公众号所载资料所造成的任何后果,中金公司及/或其关联人员均不承担任何形式的责任。
本公众号仅面向中金公司中国内地客户,任何不符合前述条件的订阅者,敬请订阅前自行评估接收订阅内容的适当性。订阅本公众号不构成任何合同或承诺的基础,中金公司不因任何单纯订阅本公众号的行为而将订阅人视为中金公司的客户。
一般声明
本公众号仅是转发中金公司已发布报告的部分观点,所载盈利预测、目标价格、评级、估值等观点的给予是基于一系列的假设和前提条件,订阅者只有在了解相关报告中的全部信息基础上,才可能对相关观点形成比较全面的认识。如欲了解完整观点,应参见中金研究网站(http://research.cicc.com)所载完整报告。
本资料较之中金公司正式发布的报告存在延时转发的情况,并有可能因报告发布日之后的情势或其他因素的变更而不再准确或失效。本资料所载意见、评估及预测仅为报告出具日的观点和判断。该等意见、评估及预测无需通知即可随时更改。证券或金融工具的价格或价值走势可能受各种因素影响,过往的表现不应作为日后表现的预示和担保。在不同时期,中金公司可能会发出与本资料所载意见、评估及预测不一致的研究报告。中金公司的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本资料意见不一致的市场评论和/或交易观点。
在法律许可的情况下,中金公司可能与本资料中提及公司正在建立或争取建立业务关系或服务关系。因此,订阅者应当考虑到中金公司及/或其相关人员可能存在影响本资料观点客观性的潜在利益冲突。与本资料相关的披露信息请访http://research.cicc.com/disclosure_cn,亦可参见近期已发布的关于相关公司的具体研究报告。
本订阅号是由中金公司研究部建立并维护的官方订阅号。本订阅号中所有资料的版权均为中金公司所有,未经书面许可任何机构和个人不得以任何形式转发、转载、翻版、复制、刊登、发表、修改、仿制或引用本订阅号中的内容。