服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

关于CXL,你想知道的都在这里

日期: 来源:半导体行业观察收集编辑:

来源:内容由半导体行业观察(ID:icbank)编译自rambus,谢谢。


指数级的数据增长促使计算行业开始进行突破性的架构转变,以从根本上改变数据中心的性能、效率和成本。


为了继续提高性能,服务器正越来越多地转向异构计算架构,使用专门构建的加速器从 CPU 卸载专门的工作负载。CXL 的内存缓存一致性允许在 CPU 和加速器之间共享内存资源。


此外,CXL 支持部署新的内存层,可以弥合主内存和 SSD 存储之间的延迟差距。这些新的内存层将增加带宽、容量、提高效率并降低总体拥有成本 (TCO)。凭借这些诸多优势,业界果断地将 CXL 融合为处理器、内存和加速器的高速缓存一致性互连。


CXL通过一个叫做CXL 联盟的开放行业标准组织开发技术规范,促进新兴使用模型的性能突破,同时支持数据中心加速器和其他高速增强功能的开放生态系统。


CXL简介:什么是 Compute Express Link?


CXL是一个开放标准的行业支持的缓存一致性互连,用于处理器、内存扩展和加速器。从本质上讲,CXL 技术在 CPU 内存空间和连接设备上的内存之间保持内存一致性。这支持资源共享(或池化)以获得更高的性能,降低软件堆栈的复杂性,并降低整体系统成本。CXL 联盟已经确定了将采用新互连的三类主要设备:


类型1设备:智能 NIC 等加速器通常缺少本地内存。通过 CXL,这些设备可以与主机处理器的 DDR 内存进行通信。


类型2设备:GPU、ASIC 和 FPGA 都配备了 DDR 或 HBM 内存,并且可以使用 CXL 使主机处理器的内存在本地可供加速器使用,并使加速器的内存在本地可供 CPU 使用。它们还共同位于同一个缓存一致域中,有助于提升异构工作负载。


类型 3 设备:内存设备可以通过 CXL 连接,为主机处理器提供额外的带宽和容量。内存的类型独立于主机的主内存。


CXL 协议和标准


CXL 标准通过三种协议支持各种用例:CXL.io、CXL.cache 和 CXL.memory。


CXL.io:该协议在功能上等同于 PCIe 协议,并利用了 PCIe 的广泛行业采用和熟悉度。作为基础通信协议,CXL.io 用途广泛,适用于广泛的用例。


CXL.cache:该协议专为更具体的应用程序而设计,使加速器能够有效地访问和缓存主机内存以优化性能。


CXL.memory:该协议使主机(例如处理器)能够使用加载/存储命令访问设备连接的内存。


这三个协议共同促进了计算设备(例如 CPU 主机和 AI 加速器)之间内存资源的一致共享。从本质上讲,这通过共享内存实现通信简化了编程。用于设备和主机互连的协议如下:


类型 1 设备:CXL.io + CXL.cache

类型2设备:CXL.io + CXL.cache + CXL.memory

类型 3 设备:CXL.io + CXL.memory


Compute Express Link 与 PCIe:这两者有什么关系?


CXL 建立在PCIe的物理和电气接口之上,其协议建立了一致性、简化了软件堆栈并保持与现有标准的兼容性。具体来说,CXL 利用 PCIe 5 功能,允许备用协议使用物理 PCIe 层。当支持 CXL 的加速器插入 x16 插槽时,设备会以每秒 2.5 千兆传输 (GT/s) 的默认 PCI Express 1.0 传输速率与主机处理器的端口进行协商。只有双方都支持 CXL,CXL 交易协议才会被激活。否则,它们作为 PCIe 设备运行。


CXL 1.1 和 2.0 使用 PCIe 5.0 物理层,允许通过 16 通道链路在每个方向上以 32 GT/s 或高达 64 GB/s 的速度传输数据。


CXL 3.0 使用 PCIe 6.0 物理层将数据传输扩展到 64 GT/s,支持通过 x16 链路进行高达 128 GB/s 的双向通信。


CXL 2.0 和 3.0 有什么新功能?


首先在内存池方面,CXL 2.0 支持切换以启用内存池。使用 CXL 2.0 交换机,主机可以访问池中的一个或多个设备。尽管主机必须支持 CXL 2.0 才能利用此功能,但内存设备可以是支持 CXL 1.0、1.1 和 2.0 的硬件的组合。在 1.0/1.1 中,设备被限制为一次只能由一台主机访问的单个逻辑设备。然而,一个 2.0 级别的设备可以被划分为多个逻辑设备,允许多达 16 台主机同时访问内存的不同部分。



例如,主机 1 (H1) 可以使用设备 1 (D1) 中一半的内存和设备 2 (D2) 中四分之一的内存,以将其工作负载的内存需求与内存池中的可用容量完美匹配. 设备 D1 和 D2 中的剩余容量可由一台或多台其他主机使用,最多可达 16 台。设备 D3 和 D4 分别启用了 CXL 1.0 和 1.1,一次只能由一台主机使用。


CXL 3.0 引入了对等直接内存访问和对内存池的增强,其中多个主机可以一致地共享 CXL 3.0 设备上的内存空间。这些功能支持新的使用模型并提高数据中心架构的灵活性。


其次来到交换方面;


通过转向 CXL 2.0 直连架构,数据中心可以获得主内存扩展的性能优势,以及池内存的效率和总体拥有成本 (TCO) 优势。假设所有主机和设备都支持 CXL 2.0,则“切换”通过 CXL 内存池芯片中的交叉开关集成到内存设备中。这可以保持较低的延迟,但需要更强大的芯片,因为它现在负责交换机执行的控制平面功能。通过低延迟直接连接,连接的内存设备可以使用 DDR DRAM 来扩展主机主内存。这可以在非常灵活的基础上完成,因为主机能够访问处理特定工作负载所需的尽可能多的设备的全部或部分容量。


CXL 3.0 引入了多层交换,支持交换结构的实施。CXL 2.0 支持单层交换。借助 CXL 3.0,启用了交换结构,其中交换机可以连接到其他交换机,从而大大增加了扩展的可能性。


第三,“按需”内存范例;


类似于拼车,CXL 2.0 和 3.0 在“按需”的基础上为主机分配内存,从而提供更高的内存利用率和效率。该架构提供了为标称工作负载(而不是最坏情况)配置服务器主内存的选项,能够在需要时访问池以处理高容量工作负载,并为 TCO 带来更多好处。最终,CXL 内存池模型可以支持向服务器分解和可组合性的根本转变。在此范例中,可以按需组合离散的计算、内存和存储单元,以有效地满足任何工作负载的需求。


第四,完整性和数据加密 (IDE);


分解——或分离服务器架构的组件——增加了攻击面。这正是 CXL 包含安全设计方法的原因。具体来说,所有三个 CXL 协议都通过完整性和数据加密 (IDE) 来保护,IDE 提供机密性、完整性和重放保护。IDE 在 CXL 主机和设备芯片中实例化的硬件级安全协议引擎中实现,以满足 CXL 的高速数据速率要求,而不会引入额外的延迟。应该注意的是,CXL 芯片和系统本身需要防止篡改和网络攻击的保护措施。在 CXL 芯片中实现的硬件信任根可以为安全启动和安全固件下载的安全和支持要求提供此基础。


第五,将信令扩展到 64 GT/s;


CXL 3.0 带来了标准数据速率的阶跃函数增加。如前所述,CXL 1.1 和 2.0 在其物理层使用 PCIe 5.0 电气:32 GT/s 的 NRZ 信号。CXL 3.0 秉承了以广泛采用的 PCIe 技术为基础构建的相同理念,并将其扩展到 2022 年初发布的最新 6.0 版 PCIe 标准。使用 PAM4 信号将 CXL 3.0 数据速率提高到 64 GT/s。我们涵盖了 PCIe 6 中 PAM4 信令的详细信息——您需要知道的一切。


得益于CXL的出现,开发者可以简化和改进低延迟连接和内存一致性,显著提高计算性能和效率,同时降低 TCO。此外,CXL 内存扩展功能可在当今服务器中的直接连接 DIMM 插槽之上实现额外的容量和带宽。CXL 使得通过 CXL 连接设备向 CPU 主机处理器添加更多内存成为可能。当与持久内存配对时,低延迟 CXL 链路允许 CPU 主机将此额外内存与 DRAM 内存结合使用。大容量工作负载的性能取决于大内存容量,例如 AI。考虑到这些是大多数企业和数据中心运营商正在投资的工作负载类型,CXL 的优势显而易见。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3334内容,欢迎关注。

推荐阅读


颠覆EUV光刻?不让ASML独美!

苹果芯片所用的这项技术,潜力巨大!

中国半导体设备供应商的2022


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码,回复下方关键词,阅读更多

晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

回复 投稿,看《如何成为“半导体行业观察”的一员 》

回复 搜索,还能轻松找到其他你感兴趣的文章!

相关阅读

  • 手把手教你玩转SSH端口转发

  • 什么是SSH端口转发SSH隧道或SSH端口转发是一种在客户端和服务器机器之间创建加密SSH连接的方法。通过设置转发使得两台不相干的主机建立联系。使其两者能够互通。ssh端口转
  • 如何在 Android 设备上运行 Linux

  • 点击上方蓝字 ● 关注Linux公社 想在 Android 上运行 Linux?以下是无root设备和有root设备在手机上运行 Linux 桌面的方法。如果您正在阅读本文,那么您可能以前使用过 Lin
  • 单位厨房设备是不可或缺的“后勤保障”

  • 食堂作为一个为企事业单位员工提供集中餐饮服务的场所,是体现企事业单位员工关怀和员工管理的重要窗口之一。企事业单位为员工提供一个好的食堂环境和餐饮服务,能够提高员工
  • 中国半导体设备最新状况

  • 虽知易行难,但行胜于言。作者 | L晨光来源 I 半导体行业观察(ID:icbank)半导体设备市场,又泛起了波澜。芯片制造实力被视为是未来全球半导体产业竞争的核心,而半导体设备作为芯片
  • 6050元、6650元,小主机,RTX3060Ti、RX6800

  • 们的网店,把图片保存在手机里,用手机淘宝扫码,即可直达。客服回复留言,一般半天后。售后问题,别旺旺留言了,会耽误事,直接打机身侧面贴着的电话号码。https://zzpcgfd.taobao.com/
  • Magic Leap新头显的设计内幕

  • 编者按:刚开始的时候,Magic Leap 一度站上了炒作的巅峰。惊艳的概念视频让很多人对增强现实的未来充满了憧憬。但 Magic Leap 1 推出之后的表现却让人大失所望,原先它许诺的东
  • 边缘计算将解决物联网的最大问题

  • 2021年将展示分布式计算的真正力量,其中的重要处理不是在云中的集中式服务器中进行,而是在网络“边缘”进行(我们所依赖的大部分数据都是在这里生成)。这将带来巨大的收益,不仅是
  • HJT救星真要来了?

  • 0BB优势:良率高、省银浆、提功率。(1)良率高:传统红外焊容易导致隐裂、偏移等问题,而0BB焊接是UV灯管照射,几乎没有损伤,所以0BB良率比传统串焊机高,预计能做到99%。(2)省银浆:HJT效果
  • HTTP 3.0彻底放弃TCP,TCP到底做错了什么?

  • 将 脚本之家 设为“星标⭐”第一时间收到文章更新作者 l Hollis来源 l Hollis(ID:hollischuang)从HTTP/1.0开始,一直到HTTP/2,不管应用层协议如何改进,TCP一直以来都是HTTP协议的

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 关于CXL,你想知道的都在这里

  • 来源:内容由半导体行业观察(ID:icbank)编译自rambus,谢谢。指数级的数据增长促使计算行业开始进行突破性的架构转变,以从根本上改变数据中心的性能、效率和成本。为了继续提高性能
  • 芯片行业,集体过冬!

  • 正如大家所看到,自去年下半年以来,经济的不景气传导到芯片领域,导致需求急转直下。再叠加地缘政治等因素的影响,全球半导体的下行加速。一方面,芯片企业业绩大幅下滑,晶圆厂也都纷
  • 英伟达的崛起是运气?黄仁勋这样回答!

  • 来源:内容由半导体行业观察(ID:icbank)编译自CNBC,谢谢。大约四分之一个世纪以来,Nvidia一直引领着计算机图形学的革命,一路走来成为游戏玩家钟爱的品牌。Nvidia 在图形处理单元 (G
  • 韩国埋怨,美国芯片法案要求太多

  • 来源:内容由半导体行业观察(ID:icbank)编译自WSJ,谢谢。美国芯片法案悬在全球最大的半导体制造商面前提供数十亿美元的补贴,但韩国表示附加条件太多。政府官员和行业分析师表示,接
  • 为何他们还敢建那么多晶圆厂?

  • 来源:内容来自电脑王,谢谢。芯片淘金热已经结束了,过去一个月惨淡的收入可能会让您相信这一点。电子巨头三星在Q4的利润下降了69%,而整体收入下降了8%。与此同时,韩国记忆体制造