Rambus HBM4的控制器IP提供了32个独立通道的接口,总数据宽度可达2048位。基于这一数据宽度,当数据速率为6.4Gbps时,HBM4的总内存吞吐量将比HBM3高出两倍以上,达到1.64TB/s。与Rambus HBM3E控制器一样,HBM4内存控制器IP也是一个模块化、高度可配置的解决方案。

随着大语言模型(LLMs)的参数量已跨越万亿大关,并持续呈现增长态势,在此背景下,突破内存带宽与容量的固有瓶颈,对于满足AI在训练和推理过程中对实时性能的迫切需求,显得尤为关键。为了更好更快的帮助客户在其最先进的处理器与加速器中应用HBM4,Rambus日前率先推出业界首款HBM4控制器IP解决方案。

AI计算对高性能内存需求迫切

AI通常可以分为AI训练和AI推理这两个不同的过程。在AI训练阶段,不但需要给AI提供大量的数据,让它对这些数据进行分析,提取出其中的规律,形成一个AI模型。而且训练周期往往是数以周计,甚至数以月计,才可以实现完整的AI模型训练。

AI训练可以说是目前计算领域中最具挑战性和最难完成的任务之一,因为在这个阶段需要管理和处理的数据量极为庞大。如果训练过程能够越快完成,就意味着AI模型能够更早投入使用,从而帮助投资者尽早获得回报,并最大化投资回报率。

一旦模型完成了基于大量数据的训练,就可以将其应用于实际场景,并提供新的、模型未曾见过的案例进行推理,这就是AI推理阶段。在这一阶段,对性能也有较高要求,尤其是在推理速度和准确性上。毕竟,在通过大量真实案例对模型进行训练之后,我们期望它能够快速且准确地得出正确的结果。 

这两个步骤对内存的高性能需求各自提出了独特的挑战,既需要确保其既足够快速,性能足够强大,尺寸足够小。在推理阶段,还需要更短的延迟和更高的带宽,因为推理结果必须几乎实时地快速给出。

Rambus研究员兼杰出发明家Steven Woo博士用下图直观展现了内存市场需求快速增长和变化的趋势。可以看到,自2012年以来,内存对速度、容量和尺寸的要求每年都在以超过10倍的速度增长,且没有减缓的迹象。以大语言模型GPT为例,2022年11月发布的GPT-3使用了1750亿个参数,而今年5月发布的最新版本GPT-4o则使用了超过1.5万亿个参数。

Rambus研究员兼杰出发明家Steven Woo博士

“过去几年里,这些大语言模型的规模增长了超过400倍,但在相同时间内硬件内存的规模仅增长了2倍。”Steven Woo博士指出,这就意味着,要完成这些AI模型的任务,就必须投入额外数量的GPU和AI加速器,才能满足对内存容量和带宽的需求。

 

HBM异军突起

与DDR、LPDDR、GDDR相比,HBM凭借远高于普通DRAM的带宽和密度,得到了AI训练、高性能计算和网络应用等场景的垂青。

从构造结构来看,HBM中的DRAM内存首先通过中介层的物理连接与处理器相连,之后所有组件再连接到基板上,最终焊接在PCB上。HBM的DRAM堆栈采用多层堆叠架构,其中一个内存芯片可以直接连接处理器,每个HBM内存设备与处理器之间的数据通路由1024根“线”或信号路径组成,因此这种设计带来了极高的内存带宽、大容量和高能效。

下图展示了不同代际的HBM内存在数据传输速度、单个堆栈带宽、堆栈厚度以及最大设备容量等方面的具体参数。

可以看出,从HBM第一代到第二代、2E、3E,每一代的最明显变化就是单个堆栈带宽的急剧增加。以HBM3为例,随着命令、地址、时钟和其他附加信号的加入,HBM3所需的信号路径数量增加到约1700条,HBM3E单个设备的带宽超过了1.2TB/s,上千条信号路径远远超出了标准PCB所能支持的范围。因此,采用硅中介层作为桥梁,将内存设备和处理器连接起来,用类似于集成电路的工艺在硅中介层上蚀刻出间距非常小的信号路径,从而实现所需的信号线数量以满足HBM接口的要求。

目前,主要的DRAM制造商,如SK海力士、美光和三星,已经宣布推出HBM3E设备,数据传输速率最高可达9.6Gbps。正是由于这种精巧的结构设计和HBM DRAM的堆叠方式,HBM内存才能提供极高的内存带宽、优异的能效、极低的延迟,同时占用最小的面积。

在这一趋势推动下,HBM4正成为由JEDEC制定的下一代内存技术标准。从已知的资料来看,HBM4每个堆栈的带宽达到了1.6TB/s,将超过HBM3E,也使得最终的实际带宽会更高。

业内首款HBM4控制器IP

为了帮助处理器厂商和开发人员更轻松地集成和使用HBM4内存,Rambus日前宣布推出业内首款HBM4控制器IP,可以支持新一代HBM内存的部署,适用于最先进的处理器,包括AI加速器、图形处理器和高性能计算应用。

如前文所述,Rambus HBM4的控制器IP提供了32个独立通道的接口,总数据宽度可达2048位。基于这一数据宽度,当数据速率为6.4Gbps时,HBM4的总内存吞吐量将比HBM3高出两倍以上,达到1.64TB/s。与Rambus HBM3E控制器一样,HBM4内存控制器IP也是一个模块化、高度可配置的解决方案。

根据客户在应用场景中的独特需求,Rambus还提供定制化服务,涵盖尺寸、性能和功能等方面,关键的可选功能包括ECC、RMW和错误清理等。此外,为了确保客户能够根据需要选择各种第三方PHY并应用于系统中,Rambus还与领先的PHY供应商在匹配、认证和验证等环节开展了合作,确保客户在开发过程中能够一次流片成功。 

HBM 4的种种变化给Rambus带来的挑战是多方面的:一是确保控制器不会影响处理器上周围的其他模块;二是确保芯片时序收敛的挑战,以便能够拥有能够以所需速度工作的成功的芯片;第三,通道数增加还带来了实施挑战,例如封装复杂性、功率密度增加以及散热和DRAM刷新管理挑战;第四,如何确保Rambus的IP能够与系统的其他部分(如PHY和处理器的其余部分)无缝连接。

“我们花费了大量时间来确保我们的HBM4控制器IP的兼容性,并能够实现快速集成和首次硅片成功。这些是任何IP提供商都将面临的最困难的挑战。“Steven Woo博士说。

依托于多年来在HBM内存领域积累的丰富经验,Rambus目前已经成功完成了超过100次的HBM设计,并成功交付了业界领先的HBM3E内存控制器,以及业界最高数据传输速率的HBM2E内存控制器(速率达到每秒4Gbps)。

为帮助客户实现一次流片成功,Rambus在控制器测试平台、验证IP和物理中介层PHY三方面与生态伙伴展开合作。例如长期与西门子旗下的Avery Design Systems公司合作,并提供多种BFM,包括内存模块BFM、主机内存控制器BFM和PHY BFM。同时,对于客户所需要在控制器上进行的测试,Rambus提供非常广泛的测试序列,也可以执行特定控制器和PHY的测试序列,还使用了基于功能覆盖率的验证计划,确保完整性。 

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
由于供应过剩,SK Hynix计划在上半年将其NAND闪存产量减少10%,NAND闪存价格已经连续四个月下跌,SK Hynix的减产举措反映了对当前市场环境的应对策略......
半导体行业正迎来一个新的建设高峰期,SEMI预测,2025年,全球范围内将有18个新的晶圆厂项目开始建设,其中15座为12英寸晶圆厂,3座为8英寸晶圆厂,大部分预计将于 2026 年至 2027 年开始运营......
此次收购被视为奥康国际跨界进入半导体行业的重大举措,旨在通过多元化发展来改善公司的财务状况。但交易双方进行了多轮协商和谈判后,在交易方案的细节条款上存在分歧……
CMC清单主要与美国对中国高科技企业的打压以及对抗中国军民融合战略有关。
三星在 HBM3E市场落后于SK Hynix,正计划通过采用先进工艺最大限度地提高 HBM4 的性能。三星电子的存储业务部门成功完成了HBM4内存逻辑芯片的设计,并交由Foundry业务部采用4nm工艺进行试产......
SK海力士将在CES2025,展出HBM、企业级固态硬盘(eSSD)等面向AI的代表性存储器产品,也将展示专为端侧AI优化的解决方案和下一代面向AI的存储器产品。
大多数研发人员和导热界面材料配方设计师可能会推荐使用具备诸多优异特性的硅。然而,也存在一些例外情况。这些问题强调了在选择导热界面材料时考虑终端产品最终应用的重要性.....
在与芯科科技(Silicon Labs)首席技术官Daniel Cooley的交谈中,我们了解到该公司在物联网(IoT)和智能边缘领域所发挥的作用和未来发展。
虽然绕过产品防伪保护的手段变得越来越高级,但是最新的 NFC 芯片技术提高了信息安全性,让品牌能够保护知识产权,预防客户误买假冒商品。
西门子推出Simcenter更新版本,助力客户简化工作流程,加快航空航天认证,同时提供深入洞见
文|温风回顾完过去,再聊聊新的一年,沃尔沃从产品层面,还有哪些亟待解决的问题?首先是纯电高端化的挑战。这不是沃尔沃一家的命题,宝马i5/i7,奔驰EQE/EQS,没有一款对自身旗下传统动力车型产生强烈
 /记得星标我/比大部分人早一步看见未来在日新月异的数字浪潮中,中小企业作为国家经济的生力军,正站在数智化转型的十字路口。中国移动,作为信息通信领域的领军者,积极响应国家政策,以科技创新为笔,绘制出一
“什么是5G,用户说了算”。记得在5G商用之前,当人们都在谈论5G是什么、5G到底能做啥时,这句话引起了业界广泛共鸣——5G建设和发展需倾听用户的声音,以消费者和各行各业日益增长的需求为导向。时至今日
尊敬的会员主联系人:为提升服务品质,自2025年1月起,IPC中国团队将定期整理会员裨益最新资讯,请将此文转发给相关同事,方便大家及时了解和使用会员裨益。一、会员免费标准下载2024年11月份发行了5
论坛信息名称:第六届半导体湿电子化学品与电子气体论坛时间:2025年3月19日地点:浙江杭州主办方:亚化咨询日程安排3月18日16:30~20:00   会议注册3月19日09:00~12:00   
目前,联想已经在印度工厂生产笔记本电脑和台式电脑,后续还将生产 AI 服务器,而摩托罗拉智能手机、平板电脑和笔记本电脑也在由代工商 Dixon Technologies 进行生产。联想印度公司总经理
文|温风2024是所有豪华品牌都不好过的一年。中国市场豪华品牌在参与价格战和不参与价格战中反复横跳,也牵动着跨国品牌全球市场的销量和财报数字。想在全球豪华市场榜单脱颖而出,就必须在销量占全球近1/3,
‌‌Jan. 21, 2025 产业洞察根据TrendForce集邦咨询调查1月21日嘉义地区芮氏规模6.4地震对邻近的晶圆代工厂、面板厂影响情况,TSMC(台积电)及UMC(联电)的台南厂因震度达4
面板价格观察-1月下旬版昨日,TrendForce集邦咨询公布了1月下旬面板报价,TrendForce集邦咨询表示:2025年1月下旬,电视面板价格上涨;显示器、笔记本面板价格持稳。1电视进入1月份,
近日,纳芯微宣布推出全新基于AMR(各向异性磁阻技术)的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏感单元与ASIC技术,能够精准监测车轮转速,为防抱死制动系统(ABS)、车身电子