在德国刚刚结束的ISC18大会上,中国军团以206套系统的优异成绩夺得TOP500超算排行榜的冠军,这也是中国军团在超算入围数量上再一次超越美国。相比之前的微弱优势来说,这次中国以206比124获得了压倒性的胜利。联想作为中国军团的代表之一,更是以117套系统入围卓越表现获得了厂商份额的第一名,提前2年实现了既定目标。
这是一项了不起的成绩。在此之前,联想曾经4次荣膺全球第二、中国第一,榜首的差距只在毫厘之间。而这次,联想超越第二名近50%的份额,充分展现了第一名的实力和底气。借着本次夺冠的春风,我们有幸采访到了联想首席科学家祝明发、联想数据中心业务集团中国区企业级营销产品营销总监李炜和联想数据中心业务集团教育行业总监蔡斯扬三位嘉宾,听他们讲述联想高性能计算的历程。
新品不断,深耕技术开出璀璨之花
在本次ISC18大会的展厅,联想的展台的黑红搭配显得非常醒目,特别是展厅高耸的DataCentre整机柜解决方案更是让许多来参观的人流连驻足。在这里,我们看到了联想ThinkSystem系列的多款主打产品,包括能够支持4块GPU加速卡的SR670和本次展示的新品:采用联想第三代液冷技术的“海王星”服务器——SD650。
这就是“海王星”的真身了,也是采用了第三代冷板式液冷散热技术的产品。如今,面对高性能计算应用的高要求,许多厂商都提供了更高计算密度、更大存储容量和更强互联带宽的产品,这些产品带来性能提升的同时,也带来了功耗控制的难题。为此,业内很早就探寻采用液冷方式进行散热的方案,本次我们提到的“海王星”就是这样一款采用最新技术的产品。
“早在2007年,联想就推出了第一代液冷散热方案。如今我们这次上市的第三代产品采用了温水技术,水温从上一代的45提升到了50℃。不仅如此,我们还在这一代产品中融入了许多关键性的技术,比如我们将散热效率提升到了90%以上,这已经接近于液冷散热方式的极限”。李炜表示。
所谓“温水水冷”,顾名思义就是通过温水对数据中心的服务器进行散热的技术。之所以采用温水来降温,是联想通过大量实验数据分析认为,进水的温度定为35-45℃范围之间,出水温度在45-55℃左右可以获得最佳的能耗比和经济效用,这样服务器的水冷循环系统将实现全年自然冷却,从而大幅降低数据中心PUE值。
而如今,温水水冷的温度进一步提升到了50℃,相比之前还是有了10%以上的提升。我们知道,数据中心散热的温度非常宝贵,据统计数据中心每提升一度,大约会节省4%的能源费用。由此算来,当水温达到50℃的时候,将为数据中心节约大量的能源,大大节约电费开支,提升使用效率。
李炜在介绍中同时提到了国内第一家采用温水水冷散热的高校HPC系统——北大未名一号。就在今年年初,部署在北京大学的高性能计算平台“未名一号”正式投入使用,成为北京大学第七个校级平台。
据了解,北京大学高性能计算校级公共平台未名一号由227个节点组成,其中计算节点196个、GPU节点10个、KNL节点8个、胖节点3个、管理和登录节点6个、IO节点4个,存储采用GSS24存储系统,容量2784.8TB,计算网络采用Omni-path架构,编译器采用GNU和Intel最新编译器套件,作业管理采用Slurm作业调度系统,集群管理采用LiCO集群监控管理套件。该集群系统理论计算峰值高达411万亿次/秒,计算节点理论峰值261万亿次/秒,实测计算能力达到242万亿次/秒。
恰恰是采用了联想特色的温水水冷技术,未名一号的相比传统的风冷散热技术有了跨越式的进步,Linpack效率达到92.6%,PUE值控制达1.1。这意味着,“未名一号”将可节省50%的制冷散热成本,每年将为北京大学节省60万度高性能计算平台用电。
教育行业硕果累累,联想助力科研腾飞
北京大学的超算中心只是联想教育行业应用的典型案例之一,类似这样的案例在联想多年的HPC市场深耕中已经不胜枚举。据联想数据中心业务集团教育行业总监蔡斯扬则认为,近年来联想在教育行业发展的速度超过了过去两三的总和,联想也努力将一直坚持的事情继续做好,无论是大规模设备还是小规模设备。“客户买的每一套机器,我们帮助客户把机器用好”,他说。
“南京大学有位女教授是研究大气湍流的,以前也是在美国做这个研究,找不到这样的机器最后回到了南京大学。在看到联想帮助南京大学部署的系统之后,她特别兴奋地跟我说,我用这套机器把我湍流的计算的精度从过去的100米现在缩小到了5米,这是一个质的飞跃,从原有预测误差的几百上千公里,下降到了现在的十公里之内”。
蔡斯扬口中的这位女教授,是南京大学的雷荔傈教授,她是2016年江苏特聘教授,也是美国宾夕法尼亚大学的气象博士。在美国,雷荔傈一直从事气象学的研究工作,但是自从回到南京大学任教,应用了全新的联想FLEX高性能计算机之后,雷荔傈觉得之前美国的那些设备简直是“弱爆了”。
助于FLEX平台的帮助,雷荔傈的研究成果也获得大大提升,台风的大涡模拟变量维度达到了10的11次方,从而更准确的模拟台风,更准确的实现台风预报。与此同时,雷荔傈还分析了2016年台风季节的集合同化和模拟。相比于欧洲中心和美国国家环境预报中心的预报,她的研究成果模式精度达到了6KM(欧洲和美国分别是18KM和56KM),一共使用2400和处理器核心,总输出文件达到了150TB。
据悉,这套部署在南京大学的FELX超算平台具备910个CPU计算节点,有21840个CPU核心,理论计算峰值达到870万亿次秒。不仅如此,联想还提供了包括软件、调优等一系列服务,诸如软硬件5年质保,专人驻场等服务,完全能够解决南京大学的后顾之忧,让师生专心投入研发与应用当中。
联想HPC生意经:精益求精,不断进取
作为联想首席科学家,HPC领域的前辈,祝明发很感慨如今联想在HPC领域取得的成就,也更知其中的艰难。“中国什么时候开始进入TOP500的?是2002年。那时候联想的深腾1800首次进入TOP500的排名,如今算下来已经有16年的历史了”。
听着祝明发娓娓道来这段历史,现场的人不无感慨。从一无所有到如今的TOP500份额第一,联想HPC一路走来经历过多少艰辛、付出过多少努力,这些内幕不被外人熟知。
“首先就是世界级过硬的品质。多年来,联想在提升产品品质上进行了大量的投入,包括高温实验室、震动实验室、跌落实验室等等。如今,联想在中国北京、美国莫里斯维尔、德国斯图加特部署了三大AI创新中心。其次,联想对于高性能应用非常熟悉,也知道如何帮助客户获得更好的应用体验。联想始终认为,用户取得成功才算是我们成功,用户成功的标志是应用我们的计算机取得了成果”,祝明发说。
不仅如此,作为国际化的企业,联想在全球范围的高性能应用与服务层面也具备了难以匹敌的优势,包括德国、西班牙、意大利、加拿大、英国、美国、英国等许多国家和地区都能够看到联想的身影。这些国家的国情不同、客户业务不同、应用领域也是多种多样,但是联想始终能够提供让客户满意的解决方案。
高性能计算被誉为“皇冠上的明珠”,其原因就在于它一方面对计算能力、存储能力提出了较高的要求,另一方面又要求系统具备强大的可靠性和稳定性,同时还需要与应用实践相结合,这些因素加在一起,构成了高性能计算应用的难题。而如今,联想能够勇夺TOP500冠军,也从技术、市场的角度证明了产品、服务与解决方案的优异品质,值得客户的信赖。
*本文原载于《IT大嘴巴》
留言与评论(共有 0 条评论) |