天风计算机团队
摘要
最接近人类中文理解能力的AI大模型。盘古NLP大模型是业界首个千亿参数中文语言预训练模型,在预训练阶段学习了40TB中文文本数据,是最接近人类中文理解能力的AI大模型,下游应用仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。应用场景有智能舆情、智能营销等。
盘古CV大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。同时基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地,使研发成本降低90%。目前盘古CV大模型在Image Net 10%数据集上的小样本分类精度上达到目前业界最高水平。在智能巡检方面,可以进行无人机智能巡检,并解决巡检系统中数据标注工作量大和缺陷种类繁多问题。数据筛选效率提升30倍、筛选质量提升5倍,模型的精度比普通模型提升18%。智慧物流领域,可以用1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。
可实现一个模型在众多场景规模化复制,多行业受益。盘古 NLP 大模型可以实现一个 AI 大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,让 AI 开发由作坊式转变为工业化开发的新模式。我们认为,未来随着盘古系列AI大模型的上线,将持续赋能金融、电力、交通、气象、物流等行业,华为产业链及下游应用相关公司有望持续受益。
建议关注:
底座硬件:拓维信息、四川长虹、神州数码、常山北明
底座软件:麒麟信安、中国软件
2B应用:
金融:长亮科技、中科软、软通动力
电网:智洋创新、东方电子
其他:中科创达、赛意信息、东方国信
2C应用:金山办公、同花顺、科大讯飞、万兴科技、光云科技、当虹科技、视源股份
注:中科创达、视源股份为本组与电子组联合覆盖
风险提示:AI应用落地不及预期、技术发展不及预期、国内大模型进展不及预期
01
基于国产昇腾AI平台,助力人工智能普惠化。多地人工智能计算中心已经上线运营,包括深圳、武汉、成都、西安、中原、南京、杭州等城市,均基于昇腾AI基础软硬件平台建设,让城市AI算力成为新的公共资源,智能化变得更加普及。未来,各地人工智能计算中心将会相互联接,形成智算网络,这已是大势所趋。
我们预计,中国算力网为未来有望成为全国大型算力底座,为各地的人工智能计算中心、超级计算中心和“东数西算”枢纽节点等提供协同调度和高效计算服务,支撑国家“数字经济”和“东数西算”重大战略。
02
盘古大模型是由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。
2.1 盘古NLP大模型参数达2000亿,小样本学习超越GPT系
兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配;2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。
应用场景:
智能舆情:利用文档信息抽取、情感分类、文档自动摘要等关键技术,在金融、电商、政务领域实现精准舆情分析、企业运营软件分析。
智能营销:利用文本匹配,问答和对话系统、意图识别等关键技术,取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统。
2.2.盘古CV大模型:30亿参数,10亿级图像,业界最大预训练CV模型
业界最大预训练CV模型:30亿参数,10亿级图像
判别与生成联合预训练:底层/高层视觉预训练任务通用
100+场景验证:研发成本降低90%
小样本学习性能领先:ImageNet10%标签分类精度业界第一
应用场景:
智能巡检:进行无人机智能巡检,并解决巡检系统中数据标注工作量大和缺陷种类繁多问题。数据筛选效率提升30倍、筛选质量提升5倍,模型的精度比普通模型提升18%。
智慧物流:1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。
2.3.盘古气象大模型:速度较传统数值方法提升1000倍
同时,盘古气象大模型支持广泛的下游预报方案,如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模型可以降低20%以上的位置误差。
2.4.已在电力、金融等多个行业应用
国家电网:
浦发银行:
广发证券:
企业财务智能预警:2019年有496家企业被监管处罚、问询或被ST处理,利用盘古大模型预测出其中439家,覆盖率近90%,其中被监管处罚企业111家,盘古大模型全部命中,无一家遗漏。
03
盘古 NLP 大模型可以实现一个 AI 大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,让 AI 开发由作坊式转变为工业化开发的新模式。我们认为,未来随着盘古系列AI大模型的上线,将持续赋能金融、电力、交通、气象、物流等行业,华为产业链及下游应用相关公司有望持续受益。
建议关注:
底座硬件:拓维信息、四川长虹、神州数码、常山北明
底座软件:麒麟信安、中国软件
2B应用:
金融:长亮科技、中科软、软通动力
电网:智洋创新、东方电子
其他:中科创达、赛意信息、东方国信
2C应用:金山办公、同花顺、科大讯飞、万兴科技、光云科技、当虹科技、视源股份
注:中科创达、视源股份为本组与电子组联合覆盖
04
3)国内大模型进展不及预期:GPT系受到国内外广泛关注,国内加速国产大模型研发,若后续研发进展及应用不及预期,相关公司或将受到影响。
缪欣君 SAC 执业证书编号:S1110517080003
张若凡 SAC 执业证书编号:S1110521090001