虽然11月初已经在旧金山露面,但是有关最新的7nm CPU和GPU的信息,AMD在15日的大中华区合作伙伴峰会上给出了更多信息。
找到感觉的AMD,一年多来在Zen核心的道路上飞速提升,从去年的Zen、年初12nm制程的Zen+,再到率先引入7nm制程到CPU及GPU产品上,AMD实现了全面的超越。
15日,在AMD大中华区合作伙伴峰会上,AMD详细介绍了即将推出的“Zen 2”处理器核心架构的全新细节,并首次公开展示了代号为“Rome”的下一代7nm EPYC(霄龙)服务器处理器。革命性的“Zen 2”处理器核心架构采用突破性的Chiplet设计,是模块设计方法的最新成果。将这种全新的设计方法与台积电最前沿的7nm制程技术优势相结合,“Zen 2”实现了性能、电量消耗和密度的跨世代巨大提升,有助于降低数据中心的运营成本、碳足迹和散热需求;并带来了更优良的执行流水线,更优良的分支预测器,更出色的指令预取,重新优化的指令缓存和更大的运行缓存,更强的浮点性能,以及领先的安全性。
代号为“Rome”的全新一代服务器处理器率先采用先进的7nm制造工艺,拥有最高达64个“Zen 2”核心,更高的每周期指令性能以及I/O和内存带宽,首次支持PCI-E 4.0标准,与当前的AMD EPYC(霄龙)处理器相比,每个插槽的计算性能提升为2倍,每个插槽的浮点性能则为当前的4倍,并且兼容现在的AMD EPYC(霄龙)服务器平台。该处理器现在已经给客户提供样片,正式发布时间待定。
除了CPU,7nm制程也被引入到AMD Radeon Instinct MI60和 MI50加速器上。该加速器是首款采用该制程的数据中心级GPU,其超高的计算核心密度和32GB HBM2显存、PCI-E 4.0、端到端的ECC数据保护等特性,为下一代深度学习、HPC、云计算和渲染应用程序带来所需的计算性能。
此外,AMD还发布了采用12nm制程工艺的AMD Radeon RX 590显卡产品,该产品比此前的RX 580有着12%的性能、15%的频率提升,目标填补RX 580和RX VEGA 56之间近千元的市场空白。同时,该产品还带来了提升显示质量的FreeSync 2.0技术,把屏幕最高刷新速度提升到144Hz,并且有足够带宽容量传输HDR信号,进一步提升游戏体验。
大会之后,CHIP记者就新一代EPYC处理器的产品和技术问题,分别采访了AMD全球副总裁、数据中心产品部总经理Scott Aylor和AMD科学家、全球副总裁兼计算与图形首席技术官Joe Macri。
Scott Aylor:Rome的推出,不仅可以进一步提升AMD的云服务器竞争能力,同时在虚拟化的密度提升、企业级应用和HPC高性能计算等应用场景增强竞争力。另外,中国客户对成本非常敏感,AMD帮助他们定制化设计的系统很大一部分都会采用EPYC单路(服务器)设计,用以取代双路产品,更多的核心处理能力,以及更好的I/O性能、更大的内存带宽优势,对用户的吸引力非常大。除了性能更为出色的7nm制程工艺,Rome采用了新的基于Chiplet设计的ZEN 2核心架构,整体由8个计算核心芯片和1个I/O核心芯片组成,前者取消了此前产品的I/O功能,可以有效地提升整体处理器性能,同时更为对称的核心结构,可以让软件优化变得更简化,实现更高的效率。
Joe Macri:Rome的每个MCM上面有9个DIE,L3 Cache和计算核心位于运算DIE上。除了MCM的连接设计这样的改变之外,还有其他的一些提升和优化,包括能够做整数和浮点运算的幅度提升了,有更高的IPC性能,还有安全性方面的优化,7nm能够去做到更高的频率,更好的电压,所以每瓦性能能够有一个提升,另外包括在功耗,在核心数在密度方面也是有提升的。每个运算DIE和I/O DIE使用新的更高性能的GMI直接连接,I/O(128个PCI-E 4.0通道)和内存(8通道DDR4)控制功能都在后者上,这样的结构具有延迟的对称性。也就是说,包括内存的分配,任务的调度,是对称的,这是个很大的优势,我们都知道对称比不对称要容易操作很多。有关Rome的更多架构细节,正式发布后才能详细透露。Rome向前兼容Naples(上一代EPYC)并向后兼容未来的Milan,不仅是所使用的插座,还是从Rome开始采用的PCI-E 4.0都具有向前的兼容能力。考虑到兼容的需求,Rome的系统层设计没有改变,还是单路PCI-E通道数量为128个,双路时使用64个通道交叉互联。
留言与评论(共有 0 条评论) |