AI模型的规模正以每年10倍的速度持续增长,目前已突破1万亿参数。这意味着系统需要不断提升内存性能、带宽和容量,以维持处理器的高利用率并最小化延迟。在这一趋势的影响下,一些最初为数据中心开发的关键技术,开始逐步渗透到以AI PC为代表的客户端等邻近市场的新产品中。
另一个值得关注的变化,是为了满足日益增长的内存带宽和容量需求,业界正在不断开发新型内存解决方案,以增强直接附加内存(Direct Attached Memory)的能力,比如LPDDR5 CAMM2(LPCAMM2)内存模块等。
为顺应以上趋势,Rambus日前宣布推出面向下一代AI PC内存模块的完整客户端芯片组,包含两款用于客户端计算的全新电源管理芯片(PMIC),分别是适用于LPCAMM2内存模块的PMIC5200,以及适用于DDR5 CSODIMM和CUDIMM的PMIC5120。
搭载Rambus PMIC和SPD Hub芯片的LPCAMM2内存模块
搭载Rambus PMIC、CKD和SPD Hub芯片的DDR5 CSODIMM内存模块
这两款PMIC与此前发布的客户端时钟驱动器(CKD)和串行检测(SPD)集线器,共同组成了适用于AI笔记本电脑、台式电脑和工作站内存模块的完整芯片组解决方案。此外,随着这两款全新PMIC的推出,Rambus现在可以为服务器和客户端的所有JEDEC标准DDR5和LPDDR5内存模块提供完整内存接口芯片组。
而在进军AI PC市场之前,Rambus的各类产品在数据中心服务器中已经得到了广泛部署。如下图所示,在左侧的DDR5 RDIMM模块中就包含一颗RCD(寄存时钟驱动器)、一颗电源管理IC(PMIC)、一个SPD集线器以及两个温度传感器。所有这些组件协同运作,构成了高性能的DDR5服务器RDIMM。
什么是LPCAMM?
按照Rambus内存接口芯片部门产品营销副总裁John Eble的解释,以往,专为手机设计的LPDDR通常需要紧贴应用处理器安装,以保证信号传输的稳定性,因此常常被直接焊接在主板上并靠近CPU,但这限制了它在PC上的广泛应用。
Rambus内存接口芯片部门产品营销副总裁John Eble
而LPCAMM2是近期发布的一种最初为手机设计的内存,是专为LPDDR内存设计的JEDEC标准化CAMM(Compression Attached Memory Module, 压缩附加内存模块),具备卓越的带宽和容量、紧凑的外形规格和极低的功耗,允许将多个裸晶(Die)堆叠,并通过引线键合工艺集成在单一封装之中。
鉴于变革性的“压缩附加”模块(CAMM)规格尺寸使LPCAMM2 Z轴高度低于传统SODIMM模块,这让LPDDR5能以更薄、更灵活的方式应用于终端设备。例如,我们可能已经注意到,LPCAMM的外形并非传统的矩形设计,因此,一些定制化的专有解决方案也正受到业界的关注。未来,随着业界对更高速度和更大密度的追求,外形规格的重要性将日益凸显。
而且,LPCAMM模块支持内存扩展及模块维修/更换,这对于企业笔记本电脑买家也极具吸引力。OEM厂商可能会率先将其部署在工作站级别的笔记本电脑上,作为其首发应用平台。
IDC的预测数据显示,AI PC的出货量将从当前的约5000万台,增长至2027年的超过1.67亿台。届时,AI PC在全球PC总出货量中的占比将达到约60%。
凭借LPDDR5X所能提供的额外带宽,LPCAMM2未来不仅在AI笔记本电脑,甚至在台式机领域,都将大有可为。带宽与能效之所以同等重要,是因为在固定的功耗包络下,如果内存部分的功耗得以降低,那么这部分节省下来的功率预算便可分配给GPU或专用加速器。
深入探讨PMIC
“在DDR5中,模块内置电源管理已成为其核心价值主张之一,客户端模块也充分利用了这项技术。”John Eble指出,此举的技术驱动力在于提升模块自身的电源完整性。即DIMM模块中的PMIC能够对电压进行精细调控,以减少直流(DC)和交流(AC)的电压波动。通过为客户端DIMM提供更高电压、更低电流的5V电源,不仅可以针对每个模块进行精细的实际电压调节,还能有效缓解主板上及插槽接口处的IR压降问题。
Rambus PMIC系列组合
从商业角度而言,从单一供应商处采购具备如此技术价值的客户端PMIC及其他逻辑芯片,可带来诸多益处,例如降低互操作性风险,而且由于整套芯片组可进行预先的联合验证,因此有助于缩短产品上市时间。同时,此举亦简化了供应链,并减少了认证所需的组合验证工作量。
以LPCAMM2模块芯片组中集成的PMIC5200为例。这款PMIC专为LPDDR电压轨优化设计,旨在提供业界领先的电源转换精度与效率。此外,该芯片组还包含SPD Hub,它不仅能存储非易失性配置信息,还为I2C和I3C总线提供双向重定时及再驱动功能,并集成了片上温度感应器。当这些芯片(PMIC/ SPD Hub等)协同工作时,可通过边带接口实现高度可配置的模块设计,使其能够基于核心的LPDDR5技术支持广泛的性能与容量应用场景。
第二款芯片组专为采用DDR5内存的CSODIMM和CUDIMM这两种新型客户端模块外形规格而设计。该芯片组包括PMIC5120、一颗旨在提升时钟信号完整性并减少抖动的CKD(客户端时钟驱动器),以及SPD Hub。
目前,该芯片组支持的模块速度高达每秒6400 MT/s和每秒7200 MT/s。但凭借其增强的电流供给能力,PMIC5120的架构设计已为支持所有未来DDR5数据速率做好了准备。PMIC5120和CKD本身也具备高度可配置性,可支持广泛的性能及容量应用。
在回答为何选择支持多种封装形式时,John Eble回应称,就驱动这些新型模块和芯片组的市场需求而言,更高级的应用和AI无疑是加速个人PC内存性能需求提升的关键驱动因素,而这正是推动所有这三种模块形态发展的核心动力,它们都致力于满足市场对更大内存容量和更高带宽的需求。
这些模块外形规格中的每一种,都针对PC市场中差异化的特定细分领域进行了优化。以LPCAMM和CSODIMM为例,这两者主要面向市场中的移动便携及笔记本电脑细分领域。在这些场景下,用户则通常需要在DDR5内存与LPDDR5内存之间进行抉择。而内存类型的选择,实际上是对功耗与电池续航、性能表现以及成本等多种因素综合权衡的结果。因此,不同的细分市场会基于各自的考量做出不同的决策。
差异化与前瞻性设计
John Eble表示,尽管这些产品本身是JEDEC标准组件,但Rambus致力于为客户提供超越JEDEC规范的价值。首先,Rambus进行的测试远不止于组件层面,而是扩展到广泛的系统级模块测试。工程设计人员对整个系统、固件以及接口时序训练(interface training)十分了解,能够针对任何模块提供专业的技术支持。
其次,在电源转换效率、噪声和负载瞬变方面,产品设计标准力求超越标准规格,这不仅能对计算系统中可能发生的负载瞬变做出快速精准的响应,还可以节省功耗、降低总体拥有成本(TCO),有助于客户达成其目标。
第三,考虑到内存模块在人工处理过程中可能会遇到过应力情况。新推出的PMIC在高可靠性和弹性(电过载/直流偏压)方面进行了优化,能够承受至少两倍于标称输入电压的过压,以确保其在任何应力事件下都具备高可靠性和强韧性。
而且,从目前的发展趋势来看,接口芯片大概率会朝向更高频率和更低功耗方向演进,Rambus在新产品中也已经预埋了技术升级空间。PMIC5200支持高达10.7GT/s的数据速率,其多路输出均拥有充足的电流范围,并兼容所有未来的LPDDR5速度等级,便是例证之一。此外,相关产品还集成了可编程特性,这使得客户能够在其未来的产品中实现更多的功能增强。
在谈及未来潜在的技术方向时,John Eble认为以下两方面是值得关注的:一是当前的LPCAMM模块似乎还未广泛见到支持ECC功能的产品;二是LPCAMM目前没有采用真正的信号缓冲设计,而CUDIMM和CSODIMM通常会对时钟信号进行缓冲。所以,未来在LPCAMM上实现时钟信号缓冲,乃至在各类模块形态上针对命令/地址(CA)总线甚至数据总线增加缓冲设计,以进一步提升信号完整性,或许是未来持续演进并提升性能的一条潜在技术路径。
