麒麟980,是华为有史以来投入最多、成本最高、挑战最难、创新最大的人工智能移动处理器平台。麒麟980同时创造了六个全球第一,麒麟980是全球第一个7nm工艺SoC、全球第一个ARM A76架构CPU、全球第一个双NPU、全球第一个Mali-G76 GPU、全球第一个1.4Gbps Cat.21调制解调器、全球第一个支持LPDDR4X-2133内存。当然,麒麟980除了六个“全球第一”外,还有很多可圈可点的亮点,就不再重复啰嗦了(媒体已经做了全方位的报道和解读)。
麒麟980的横空出世,既让人们看到了华为在芯片领域中超强的实力,又是值得国人们引以为豪的事。所以,国内不少的成功人士首选华为作为随身标配也是能被人理解的。在麒麟980正式问世前,全球手机芯片设计领域中的领头羊高通都已感受到了从未有过的压力,甚至不得不通过媒体造势,释放提前推出下一代旗舰处理器骁龙855的消息,以安抚小米、OPPO、vivo等手机厂商的心。
华为研发麒麟980,花费了多少钱?网络上有人写道,华为因研发这款芯片,在连续三年里投入了3亿美元。然而,华为科学家(Fellow)艾伟近日就在2018麒麟芯片媒体沟通会上说道:“麒麟980的立项时间是2015年,历经36个月+的研究与开发,共有1000多位高级半导体专家参与,进行了超过5000次的工程验证,投入远远超过外界所说的3亿美元。”
艾伟称,麒麟980的研发团队当初面临最大的挑战来自两个方面。一方面,研发团队必须在三年前就得准确判断出7nm制程能不能在2018年10月量产,如果芯片因为晶圆代工厂的7nm工艺在技术上存在问题而不能量产,则一定会给华为造成很大的产品事故。另一方面,尽管2015年华为就开始了麒麟980的立项,2016年完成定制特殊基础单元构建高可靠性IP论证,2017年进入SoC工程化验证,但如果去掉早期芯片验证的时间,实际剩下的量产周期只有半年左右。更进一步说,华为只能允许一次投片修正,否则就会影响芯片的正常流片、量产和终端适配,造成产品延期上市甚至是项目失败。
■众所周知的是,麒麟970最主要的亮点之一就是人工智能。而麒麟980在人工智能上的优势相比麒麟970肯定是更加出色。华为麒麟芯片与解决方案人工智能首席科学家芮祥麟就端侧人工智能芯片做了解读。
它可以对物体和场景进行识别,自动选择成像从“隐性”变得更加“显性”。人工智能芯片自动选择相应的拍摄模式,带来更清晰的摄影效果,5秒钟就能识别100张图片。
芮祥麟表示,人工智能芯片也被称为人工智能加速器或计算卡,专门用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责)。
人工智能芯片的计算场景可分为云端智能和终端智能。深度学习的计算场景可分为三类,分别是数据中心的训练、数据中心的推断和嵌入式设备的推断。前两者可以总结为云端的应用,后者可以概括为终端的应用。
手机智能芯片对于各种人工智能算子能够以30倍到50倍左右的速度处理,以拍照场景为例,能够做更好的一个图像检测,图像分割和图像语义理解。另外,对声音可以听清、听懂,并根据所了解的客户意图提供客户真正想要的服务。
2017年,华为在业内率先发布麒麟970处理器,这是华为首个人工智能端侧芯片,从硬件层面解决了在端侧运行人工智能模型的性能与功耗问题,这让智能终端具备了强大的运算能力。
以图像识别速度为例,麒麟970可达到约2005张每分钟,而在没有NPU的情况下每分钟只能处理97张图像,与上一代相比,图形处理性能提升20%,能效提升50%,可以更长时间支持3D大型游戏的流畅运行,支持AR/VR 等全新一代移动互联网体验。
而麒麟980在双NPU的移动端强大算力加持下,实现每分钟图像识别4500张,识别速度相比上一代提升120%,远高于业界同期水平。
芮祥麟表示,未来是云、管道、智能芯片和终端能力等四个方面整合。云侧和端侧能够做更好的协同,能够更快速地交换能力,做能力上的协调。我们必须要有这么一个开放的平台,能够把我们生态系统内所有的能力都对接进来。
为了发挥华为NPU在处理人工智能任务时的最大性能,并且把端侧最好的智能能力开放给全球Android开发者,来构建丰富的人工智能应用,华为在2017年打造了HiAI开放平台。构建了三层人工智能开放生态:服务能力开放、应用能力开放和芯片能力开放。使第三方开发者可以便捷、实时、高效、灵活地在端侧实现人工智能特性,以此极大限度地降低人工智能功能的端侧构建成本。
HiAI开放平台在自然语言理解(NLU),自动语音识别(ASR)和计算机视觉(CV)三大类,20+开放API和完备的工具平台,实现开箱即用,助力三方开发者快速丰富其产品的能力与应用场景,让人工智能触手可及。
目前,有一些合作伙伴已“享受”到了通过HiAI平台的赋能与NPU计算力的加持所带来产品能力与体验的显著提升。
如微软翻译,通过HiAI平台的加速,离线图片以及文本翻译的速度端到端整体提升了3倍。
在计算机视觉方面,性能的提升尤为突出,如在Prisma上,一张照片的风格转换的时间大抵10秒左右,通过HiAI平台加速4倍,仅需3秒左右处理完成。
同时,还能应用HiAI开放的场景识别能力,智能推荐当前照片适合的风格滤镜,用户无需在动辄几十上百个的滤镜中去选择,进一步提升用户的转换效率。
能效比上也表现不俗,快手用户在终端设备上直播,超过5分钟,有一些终端就会发热,壳温超过36度,NPU的能效比比CPU高50倍,通过HiAI平台优化,长时间直播毫无压力。
未来,随着华为人工智能芯片上的硬件创新,可以解锁更多的人工智能服务体验,例如端侧在线学习、强化学习方法,多异构芯片的人工智能模型联合调度方案,并结合端侧特征,提出人工智能运算的安全运行解决方案,保护用户隐私和数据安全。
本文综合自心声社区、电子工程专辑等媒体,我为科技狂整理发布。
留言与评论(共有 0 条评论) |