服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

英伟达:更新(浙商)

日期: 来源:半导体风向标收集编辑:浙商电子ll蒋高振


整理:by浙商电子@蒋高振团队

来源:Nvidia 2023开发者大会


一、DGX Cloud AI超级计算服务
DGX Cloud提供专用的NVIDIA DGX AI超级计算集群,搭配NVIDIA AI软件,可让企业立即访问为生成AI和其他突破性应用程序训练高级模型所需的基础设施和软件。该服务使每个企业都可以使用简单的网络浏览器访问自己的AI超级计算机,企业按月租用DGX Cloud集群,确保可快速轻松地扩展大型多节点训练工作负载的开发,而无需等待通常需求量很大的加速计算资源。

可打开浏览器访问NVIDIA AI超级计算和软件

NVIDIA Base Command™平台软件:可使用其管理和监控DGX Cloud训练工作负载,该软件可在DGX Cloud以及本地NVIDIA DGX超级计算机上提供无缝的用户体验。使用Base Command Platform,客户可将其工作负载与每项工作所需的正确数量和类型的DGX基础设施相匹配。


DGX Cloud包括NVIDIA AI Enterprise,平台的软件层,提供端到端的AI框架和预训练模型。今日发布的NVIDIA AI Enterprise 3.1提供了新的预训练模型、优化框架和加速数据科学软件库,为开发人员的AI项目提供了额外的快速启动。


行业巨头案例:

①Amgen(世界领先的生物技术公司之一)正在使用DGX Cloud和NVIDIA BioNeMo™大型语言模型软件来加速药物发现,包括NVIDIA AI Enterprise软件,内含NVIDIA RAPIDS™数据科学加速库。

②CCC Intelligent Solutions (领先的财产和意外伤害保险经济云平台,CCC)正在使用DGX Cloud来加速和扩展其AI模型的开发和培训。

③ServiceNow(数字业务平台提供商)将DGX Cloud与本地NVIDIA DGX超级计算机结合使用,以实现灵活、可扩展的混合云AI超级计算,这有助于推动其在大型语言模型、代码生成和因果分析方面的AI研究。


二、Picasso Service云服务

用途:用于构建和部署生成式AI驱动的图像、视频和3D应用程序,具有高级文本到图像、文本到视频和文本转3D功能,可通过简单云API提高创造力、设计和数字模拟的生产力。


用法:软件制造商、服务提供商和企业可使用Picasso在其专有数据上训练NVIDIA Edify基础模型,以构建使用自然文本提示的应用程序,从而为数百个用例快速创建和定制视觉内容,包括产品设计、数字孪生、讲故事和人物创作。


拓展:要构建自定义应用程序,企业还可以从Picasso的Edify模型集开始,这些模型使用完全许可的数据进行预训练,还可以使用Picasso来优化和运行生成式AI模型。


三、NVIDIA BioNeMo服务

BioNeMo Service是一种用于早期药物发现中生成AI的云服务,具有九种最先进的大型语言和扩散模型。可通过Web界面或完全托管的API访问,并且可以在NVIDIA DGX Cloud上进一步训练和优化,生物学生成式AI的工作流程得到了优化和统包。

BioNeMo服务具有九个AI生成模型,涵盖了开发AI药物发现管道的广泛应用:AlphaFold 2、ESMFold和OpenFold用于根据一级氨基酸序列预测3D蛋白质结构、用于蛋白质特性预测的ESM-1nv和ESM-2、用于蛋白质生成的ProtGPT2、MegaMolBART和MoFlow用于小分子生成、用于预测小分子与蛋白质结合结构的DiffDock等。

四、推出四种配置:L4|L40|H100 NVL|Grace Hopper

L4:一台8-GPU L4服务器将取代一百多台用于处理AI视频的双插槽CPU服务器。

L40:针对Omniverse、图形渲染以及文本转图像和文本转视频等生成式AI,推出L40,其性能是云推理GPU T4的10倍。

H100 NVL:针对ChatGPT等大型语言模型的推理,推出Hopper GPU,配备双GPU NVLink的 PCIE H100 , H100 NVL配备94GB HBM3显存,可处理拥有1750亿参数的GPT-3, 同时还可支持商用PCIE服务器轻松扩展。

Grace Hopper:新超级芯片,通过900GB/秒高速一致性芯片到芯片接口,非常适合处理大型数据集,例如推荐系统和大型语言模型的AI数据库借助Grace Hopper,Grace可以查询嵌入表,并将结果直接传入到Hopper,速度比PCIE快7倍。

五、Omniverse应用

Omniverse是实现工业数字化的数字到物理操作系统,是云原生,同时不限平台,可让团队随时随地在我们的虚拟工场中展开协作。Omniverse网络中的网络正在呈指数级增长,还连接了Siemens Teamcenter、NX和Process Simulate、RockWell Automation Emulate3D、Cesium、Unity等许多应用。

应用于汽车企业数字化:

沃尔沃汽车公司和通用汽车使用Omniverse USD Composer连接和统一其资产工作流,并将汽车零部件在虚拟环境中组装成数字孪生汽车,在工程和仿真中, Omniverse将Powerflow空气动力学可视化。

②新一代梅赛德斯-奔驰和捷豹陆虎汽车,使用Omniverse Drive Sim生成,梅赛德斯奔驰使用Omniverse为新车型构建、优化和规划组装流水线。

③丰田公司使用Omniverse构建工厂的数字孪生。


三款专为Omniverse设计的系统:

①新工作站,由NVIDIA Ada RTX GPU和英特尔最新款CPU提供动力支持,适合光线追踪、物理仿真、神经图形和生成式AI,2023年3月起,BOXX、戴尔、惠普、联想将提供这款工作站。

②新型NVIDIA OVX服务器,由Omniverse优化而来,OVX由服务器GPU Ada RTX L40和BlueField-3组成,将由戴尔、HPE、Quanta、技嘉、联想和Supermicro提供。

③Omniverse Cloud,基于NVIDIA OVX运算系统推出, 每一层Omniverse堆栈包括芯片、系统、网络和软件都是新发明,正将Omniverse连接到微软365生产力套件。


六、超算及云服务

发布Grace、Grace-Hopper和BlueField-3三款新芯片,适用于超级节能加速数据中心,更新了100个加速库,包括用于量子计算的cuQuantum、用于组合优化的cuOpt、以及用于计算光刻的cuLitho(与台积电、ASML和Synopsys合作,达到2nm及更高制程),可将计算光刻用时提速40倍。


计算光刻:500套DGX H100(包含4000颗Hopper GPU)可完成与4万颗CPU运算服务器相同的工作量,但速度快40倍,功耗低9倍,即意味着GPU加速后,生产光掩模的计算光刻工作用时可以从几周减少到八小时。


NVIDIA DGX AI超级计算机是生成式大型言模型取得突破的引擎,DGX H100 AI超级计算机正在生产,并即将通过全球不断扩大的OEM和云服务合作伴网络面世。DGX没有止步于研究,正在成为现代化AI工厂,Nvidia通过与Azure、Google GCP、Oracle OCI合作,拓展NVIDIA DGX Cloud业务模式。

七、总结

英伟达推出了新的推理平台,包括四种配置和一个体系架构:

①适用于处理AI视频的8-GPU服务器L4。

②适用于Omniverse和图形渲染的L40。

③适用于扩展LLM推理的H100PCIE。

④适用于推荐系统和向量数据库的Grace-Hopper。


此外,通过与Google合作,Google GCP成为首款NVIDIA AI云,NVIDIA AI Foundations是一个云服务和代工厂,用于构建自定义语言模型和生成式AI,包括语言视觉和生物学模型构建服务。

Omniverse是实现工业数字化的数字到物理操作系统,可以统一端到端工作流,并将价值3万亿美元的汽车行业数字化;在Azure上进行托管,与微软合作,将Omniverse Cloud引入各行业。


法律声明及风险提示

本公众号为浙商证券电子团队设立。本公众号不是浙商证券电子团队研究报告的发布平台,所载的资料均摘自浙商证券研究所已发布的研究报告或对报告的后续解读,内容仅供浙商证券研究所客户参考使用,其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,使用本公众号内容应当寻求专业投资顾问的指导和解读,浙商证券不因任何订阅本公众号的行为而视其为浙商证券的客户。
本公众号所载的资料摘自浙商证券研究所已发布的研究报告的部分内容和观点,或对已经发布报告的后续解读。订阅者如因摘编、缺乏相关解读等原因引起理解上歧义的,应以报告发布当日的完整内容为准。请注意,本资料仅代表报告发布当日的判断,相关的研究观点可根据浙商证券后续发布的研究报告在不发出通知的情形下作出更改,本订阅号不承担更新推送信息或另行通知义务,后续更新信息请以浙商证券正式发布的研究报告为准。
本公众号所载的资料、工具、意见、信息及推测仅提供给客户作参考之用,不构成任何投资、法律、会计或税务的最终操作建议,浙商证券及相关研究团队不就本公众号推送的内容对最终操作建议做出任何担保。任何订阅人不应凭借本公众号推送信息进行具体操作,订阅人应自主作出投资决策并自行承担所有投资风险。在任何情况下,浙商证券及相关研究团队不对任何人因使用本公众号推送信息所引起的任何损失承担任何责任。市场有风险,投资需谨慎。
浙商证券及相关内容提供方保留对本公众号所载内容的一切法律权利,未经书面授权任何人或机构不得以任何方式修改、转载或者复制本公众号推送信息。若征得本公司同意进行引用、转发的,需在允许的范围内使用,并注明出处为“浙商证券研究所”,且不得对内容进行任何有悖原意的引用、删节和修改。



相关阅读

  • 深夜通报:离世原因明确

  • 3月21日深夜,成都大熊猫繁育研究基地发布《关于大熊猫“宝新”有关情况的说明》。近期,部分网友持续关注大熊猫“宝新”,现将有关情况说明如下。2023年3月3日,大熊猫“宝新”出
  • 南京邮政回应

  • 近日,有媒体报道称,储户李先生等三人的243万元存款,被南京市江宁邮政局岔路口支局原局长时岱宁利用职务便利挪用。因时岱宁无履行赔付义务能力,在时岱宁被逮捕并判刑后,受害人李
  • 这个头条,很“水”!

  • “水善利万物而不争”水带来生命与活力3月22日迎来“世界水日”荆楚大地,因水而兴江河奔流,潮涌缤纷潮是什么?是日月引力造就的天地神奇是微小水滴汇聚的磅礴力量当山水营造的
  • 跨省揽才,首站重庆!

  • 3月21日,2023年重点高校春季巡回招聘活动——重庆专场在重庆大学、西南大学两所重点高校举办。此次招聘会由中共武汉市委组织部、武汉经开区管委会、武汉市人力资源和社会保
  • 明起开售!武汉直达香港

  • 3月21日,据中国铁路微信公众号消息,为进一步满足内地与香港间旅客出行需求,4月1日起,铁路部门将逐步增开广深港高铁香港西九龙站与广东省内跨境高铁列车40列、与广东省外的长途
  • 英伟达GTC大会万字纪要

  • 产业调研系列欢迎来到GTC大会,GTC是我们面向开发者的一场盛会,这个全球NVIDIA生态系统涵盖400万开发者、4万家公司和1.4万家初创公司。感谢我们的钻石赞助商,他们为我们提供大
  • 自动驾驶数据闭环系列之二——如何降本增效

  • 交流群 | 进“传感器群/滑板底盘群/汽车基础软件群/域控制器群”请扫描文末二维码,添加九章小助手,务必备注交流群名称 + 真实姓名 + 公司 + 职位(不备注无法通过好友验证)作者
  • GPT-4,大增长时代的序幕

  • 作者|成诚虽然我们早在 2017 年就预测了超大模型的到来,因此才搞了分布式深度学习框架 OneFlow(github.com/Oneflow-Inc/oneflow/),且 2020 年的 GPT-3 也掀起了大模型热潮(OneFlo
  • 一觉醒来 AI 又变天了

  • AIGC经历了疯狂一夜作者 | 新宇 志劭 智健来源 | 爱范儿(ID:ifanr)AI 的 「iPhone 时刻」已经到来在刚结束的英伟达 GTC 2023 大会上,英伟达 CEO 黄仁勋把这个观点反复说了 3

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 太原理工在这五项排名中取得历史最好成绩!

  • 2023年3月22日,中国高等教育学会高校竞赛评估与管理体系研究专家工作组发布《2022全国普通高校大学生竞赛分析报告》,太原理工大学在五项排名中均取得历史最好成绩! 在《2022年
  • 无锡地铁3条线路环评公示!

  • 内容提要近日,无锡地铁陆续发布无锡至宜兴城际轨道交通二期工程、无锡地铁6号线工程、无锡地铁5号线二期工程环境影响评价报告书公示。01无锡至宜兴城际轨道交通二期工程建