服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

【当AI遇见国家云: 盘古大模型拆解】天风计算机缪欣君团队

日期: 来源:计算机 牛骨挖掘机收集编辑:牛骨挖掘机

天风计算机团队


作者 | 缪欣君 陈涵泊 张若凡 联系人 | 王祺深


摘要


基于昇腾AI平台,打造中国智算网络。去年华为伙伴暨开发者大会2022上,“中国算力网—智算网络”上线,提出了“像建设电网一样建设国家算力网,像运营互联网一样运营算力网,让用户像用电一样使用算力服务”的发展愿景。国内多地人工智能计算中心已上线运营,均基于昇腾AI基础软硬件平台。我们预计,中国算力网为未来有望成为全国大型算力底座,支撑国家“数字经济”和“东数西算”重大战略。


最接近人类中文理解能力的AI大模型。盘古NLP大模型是业界首个千亿参数中文语言预训练模型,在预训练阶段学习了40TB中文文本数据,是最接近人类中文理解能力的AI大模型,下游应用仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。应用场景有智能舆情、智能营销等。


盘古CV大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。同时基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地,使研发成本降低90%。目前盘古CV大模型在Image Net 10%数据集上的小样本分类精度上达到目前业界最高水平。智能巡检方面,可以进行无人机智能巡检,并解决巡检系统中数据标注工作量大和缺陷种类繁多问题。数据筛选效率提升30倍、筛选质量提升5倍,模型的精度比普通模型提升18%。智慧物流领域,可以用1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。


可实现一个模型在众多场景规模化复制,多行业受益。盘古 NLP 大模型可以实现一个 AI 大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,让 AI 开发由作坊式转变为工业化开发的新模式。我们认为,未来随着盘古系列AI大模型的上线,将持续赋能金融、电力、交通、气象、物流等行业,华为产业链及下游应用相关公司有望持续受益。


建议关注:

底座硬件:拓维信息、四川长虹、神州数码、常山北明

底座软件:麒麟信安、中国软件

2B应用:

    金融:长亮科技、中科软、软通动力

    电网:智洋创新、东方电子

    其他:中科创达、赛意信息、东方国信

2C应用:金山办公、同花顺、科大讯飞、万兴科技、光云科技、当虹科技、视源股份

注:中科创达、视源股份为本组与电子组联合覆盖


风险提示:AI应用落地不及预期、技术发展不及预期、国内大模型进展不及预期


01

中国算力网——智算网络

国内AI、算力发展面临卡脖子等难题。去年8月份,英伟达收到美国政府通知,限制公司未来向中国和俄罗斯出口A100、H100,且限制还包括NVIDIA未来任何峰值性能和芯片对芯片的I/O性能均等于或大于A100的阈值的产品。同年10月,美国商务部(BIS)公布了对于中国出口管制新规声明,主要针对先进芯片及芯片制造设备,其中包括应用于AI、超算等HPC领域的CPU、GPU、AI加速器等高算力芯片或含有此类芯片的计算机商品,同时对已被列入实体名单的28家中国实体进一步加强出口管制,包括多家中国CPU、GPU芯片设计公司及AI算法公司。
“中国算力网”是鹏城实验室在国家有关部委指导下推进的算力网络计划。该计划提出了“像建设电网一样建设国家算力网,像运营互联网一样运营算力网,让用户像用电一样使用算力服务”的发展愿景。

基于国产昇腾AI平台,助力人工智能普惠化多地人工智能计算中心已经上线运营,包括深圳、武汉、成都、西安、中原、南京、杭州等城市,均基于昇腾AI基础软硬件平台建设,让城市AI算力成为新的公共资源,智能化变得更加普及。未来,各地人工智能计算中心将会相互联接,形成智算网络,这已是大势所趋。



我们预计,中国算力网为未来有望成为全国大型算力底座为各地的人工智能计算中心、超级计算中心和“东数西算”枢纽节点等提供协同调度和高效计算服务,支撑国家“数字经济”和“东数西算”重大战略。


02

华为盘古大模型——开启工业化AI开发新模式

盘古大模型是由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。



2.1 盘古NLP大模型参数达2000亿,小样本学习超越GPT系


盘古NLP大模型是业界首个千亿参数中文语言预训练模型,预训练阶段学习了40TB中文文本数据,是最接近人类中文理解能力的AI大模型。
首次使用Encoder-Decoder架构:

兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配;2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。



应用场景:

      智能舆情:利用文档信息抽取、情感分类、文档自动摘要等关键技术,在金融、电商、政务领域实现精准舆情分析、企业运营软件分析。

      智能营销:利用文本匹配,问答和对话系统、意图识别等关键技术,取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统。


2.2.盘古CV大模型:30亿参数,10亿级图像,业界最大预训练CV模型


首次实现模型按需抽取的业界最大CV大模型,首次实现兼顾判别与生成能力:
基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一。

      业界最大预训练CV模型:30亿参数,10亿级图像

      判别与生成联合预训练:底层/高层视觉预训练任务通用

      100+场景验证:研发成本降低90%

      小样本学习性能领先ImageNet10%标签分类精度业界第一



应用场景:

      智能巡检:进行无人机智能巡检,并解决巡检系统中数据标注工作量大和缺陷种类繁多问题。数据筛选效率提升30倍、筛选质量提升5倍,模型的精度比普通模型提升18%。

      智慧物流:1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。


2.3.盘古气象大模型:速度较传统数值方法提升1000倍


气象预报精度首次超过传统数值方法,速度提升1000倍:
借助创新的3DEST网络结构以及分层时间聚合算法,盘古气象大模型在气象预报的关键要素(例如,重力势、湿度、风速、温度等)和常用时间范围上(从一个小时到一周)精度均超过当前最先进的预报方法,同时速度相比传统方法提升1000倍以上。

同时,盘古气象大模型支持广泛的下游预报方案,如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模型可以降低20%以上的位置误差。



2.4.已在电力、金融等多个行业应用


国家电网:

      无人机电力巡检:基于盘古CV大模型的智能缺陷识别,视觉预训练大模型助力下游缺陷识别,进一步提升巡检效果,缺陷样本标注代价减少 85%;平均精度提升 18%。

浦发银行:

      浦慧云仓:盘古CV大模型1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。9种场景差异较大,大模型具备较强泛化能力。异常样本种类多、数量少,大模型可利用小样本数据取得高精准度结果。利用大模型的时空对齐能力,综合多摄像头数据,解决局部遮挡等问题,准确估计物体轨迹。

广发证券:

      企业财务智能预警:2019年有496家企业被监管处罚、问询或被ST处理,利用盘古大模型预测出其中439家,覆盖率近90%,其中被监管处罚企业111家,盘古大模型全部命中,无一家遗漏。

03

建议关注

盘古 NLP 大模型可以实现一个 AI 大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,让 AI 开发由作坊式转变为工业化开发的新模式。我们认为,未来随着盘古系列AI大模型的上线,将持续赋能金融、电力、交通、气象、物流等行业,华为产业链及下游应用相关公司有望持续受益。

建议关注:

底座硬件:拓维信息、四川长虹、神州数码、常山北明

底座软件:麒麟信安、中国软件

2B应用:

    金融:长亮科技、中科软、软通动力

    电网:智洋创新、东方电子

    其他:中科创达、赛意信息、东方国信

2C应用:金山办公、同花顺、科大讯飞、万兴科技、光云科技、当虹科技、视源股

注:中科创达、视源股份为本组与电子组联合覆盖

04

风险提示

1)AI应用落地不及预期:若AI相关应用的落地不及预期,相关公司或将受到影响;
2)技术发展不及预期:目前AI技术发展迅速,相关模型短时间内多次迭代,如相关技术发展速度无法匹配AI发展,相关公司或将受到影响;

3)国内大模型进展不及预期:GPT系受到国内外广泛关注,国内加速国产大模型研发,若后续研发进展及应用不及预期,相关公司或将受到影响。




注:文中报告节选自天风证券研究所已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。
证券研究报告:《当 AI 遇见国家云: 盘古大模型拆解》
对外发布时间    2023年03月24日
报告发布机构    天风证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)
本报告分析师:

缪欣君 SAC 执业证书编号:S1110517080003

陈涵泊 SAC 执业证书编号:S1110522110003

张若凡 SAC 执业证书编号:S1110521090001

相关阅读

  • 立即停用,紧急召回

  • 3月24日上海市市场监管局公开的信息显示宜家(中国)投资有限公司正在召回14260件炒锅和98403套筷子↓↓↓1、2018年10月至2022年9月生产的型号为30427237的FRUKTKAKA弗鲁卡卡印
  • 中国驻泰使馆最新发声!

  • 近日,有关泰国旅游物价、安全性的话题多次登上微博热搜。据央视新闻客户端25日消息,对于近期在社交网络上出现的涉泰旅游相关视频和言论,中华人民共和国驻泰王国大使馆25日表示
  • 逃离内卷的尽头,是外企吗

  • 这两年,外企迎来了一波就业“回潮”。社交平台上,年轻人们纷纷逃离大厂,转行外企——一个被称作内卷时代“乌托邦”的地方。(左右滑动查看更多)在996文化盛行的当下,外企的工作环

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 朋友送新人9000元刮刮乐,新郎新娘刮了一夜

  • 近日,山东一男子结婚收到发小随礼送9000元彩票新郎李先生说当时都懵了后来和妻子刮了一晚上事情发生在山东烟台。新郎表示,当时没有料到,以为是红包,后来才发现是一沓刮刮乐。“
  • 刚刚宣布:TVB裁员5%!

  • 据香港“点新闻”报道,香港电视广播有限公司(TVB)行政主席许涛3月24日向员工发信,宣布将引入优化成本及资源管理方案,目标是节省2.6亿港元的年度营运现金支出。财经网视频号截
  • ​​紧急提醒,千万别吃!0.5毫克可致死

  • 今年3月份以来,浙江省绍兴市已接连报告2起因食用河豚而引起的食源性聚集疫情,有3人中毒到医院就诊,其中重症2例,发生场所均为家庭聚餐。目前症状较重的患者经ICU全力救治,病情稳