【光电集成】先进封装芯粒间高速互联接口设计思考

今日光电 2024-09-16 18:01

 今日光电 

     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光赢未来...欢迎来到今日光电!




----追光逐电 光赢未来----

近年来,随着AIGC的发展,生产力的生成方式、产品形态都在发生重大的变化。计算规模和模型规模的不断增大,尤其是大模型的出现和广泛应用对算力的需求呈现出爆发式的增长。这一系列的变化对计算架构提出了新的挑战,首先是系统规模越来越大,系统结构越来越复杂;其次计算形态的变革,传统的计算形态,主要是基于CPU或GPU的同构计算越来越难以满足算力的持续增长。

在这一背景下,Chiplet成为非常有潜力的设计方法和解决方案。Chiplet架构可以将SoC进行拆分重组,将主要功能单元如计算、存储、传感等转变成芯粒的形式,从而支持复杂系统的异构集成。而将各种芯粒重构成为一个完整的系统则需要依赖D2D接口对其进行互联,尤其是当设计人员需要构建一个包含多种第三方芯粒的复杂系统时,一个统一的D2D互联接口成为不可或缺的组件。在此背景下,UCIe、BoW、OpenHBI等D2D互联接口协议应运而生,旨在构建一个统一的D2D互联框架。尽管协议不尽相同,D2D互联接口的底层技术存在着较多的共性,而这些共性技术是D2D接口设计人员非常重要的研究内容。

本文将从D2D接口的信道特点、D2D接口的技术指标,D2D接口的设计思考和D2D接口的设计流程革新等方面来浅谈D2D互联接口的共性技术。

D2D接口的信道特点

信道条件通常是接口研究的起点,接口电路的架构搭建、微结构选取到具体电路的实现无不以信道特性作为出发点,D2D接口的设计也不例外。相比传统高速接口,D2D接口的信道表现了较多新的特点,这主要是由D2D接口的应用环境和封装形式所带来的。众所周知,D2D接口主要用于芯粒间的高带宽数据互联,这一应用场景决定了D2D接口信道的两个主要特点:一、信道长度较短,一般局限在封装内部;二、信道数量大,布线密集。同时,这一应用场景也决定了D2D接口往往面对较为先进的封装形式,其布线通道通常是基板(substrate)甚至是硅中介层(silicon interposer),我们分别称之为D2D接口的标准封装(standard package)和先进封装(advanced package)。

相比以PCB走线为主的传统互联方式,D2D标准封装和先进封装的显著特点是节距(pitch)的减小。在标准封装中,芯片凸点(bump)的节距从传统封装的0.5~1mm减小到100~200um,而在先进封装中,这一物理尺寸进一步微缩到30~60um。这一变化首先带来了一系列信道物理尺寸的同步微缩,包括互联走线的线宽、线距和金属厚度等。而这些物理尺寸的微缩进一步引起了信道电学特性的改变。概括而言,从传统封装到先进封装,信道的单位长度电阻显著增大,而其单位长度的等效电感和电容基本保持不变。考虑到在D2D标准封装和先进封装下其信道长度显著缩短,信道整体的等效电感和电容显著缩小。具体而言,先进封装下的D2D信道的电学特性变化主要表现在如下方面:

一、插入损耗(insertion loss)

得益于D2D互联间距较短,相比传统的高速互联接口,D2D接口信道的损耗较低。我们考察了多种D2D互联协议的参考信道,在其最高工作频率下的信道损耗均小于-6dB,在实际设计信道的过程中,这一指标通常可以控制得更加优越(-2~-3dB)。较低的信道损耗使得高阶均衡不再是一个必须项,同时,简单的调制方式(如NRZ)就能实现较高数据率的传输,这些特点均为高能效数据传输提供了有利条件。

二、反射(reflection)

得益于D2D信道电学特性的变化趋势(较高的阻抗,较小的等效电感和电容),相比传统信号,D2D信道的反射特性得到了较大程度的优化,尤其是在先进封装下,信道对反射敏感的频率范围进一步推高,这一特点为D2D接口的端接方案提供了更大的空间。在D2D信道条件下,发射端的源阻抗和接收端的端接阻抗可以不要求完全匹配,设计人员可以选取更小的源阻抗和更大的端接阻抗以获取更大的信号摆幅和更小的功耗。在互联非常短的极端情况下,设计人员甚至可以选择舍弃端接电阻。

三、串扰(crosstalk)

串扰是D2D信道设计所面临的主要问题。由于D2D接口通常具有庞大的引脚数量,因此布线面积会非常受限,这将导致一些传统的结论在D2D互联场景下不再适用。通常而言,设计人员克服串扰的常用方法包括采用差分信号线以及引入屏蔽线等,而研究表明,在面积受限的情况下,单端非屏蔽方案相比差分屏蔽线方案具有更好的串扰特性,这是D2D信道显著区别于传统信道的一个重要特点。鉴于此,D2D信道的串扰特性更多地需要从返回路径上进行优化,比如采用带状线而非微带线结构,采用更薄的介质层,更完整的参考平面等。

D2D接口的技术指标

对D2D接口的技术指标的考察揭示了D2D高速接口的技术趋势。我们整理了国内外多个较为常见的D2D接口协议的技术指标,从中可以看到D2D高速接口的一些共性技术要求。基本的技术指标如封装形式(凸点节距)、信道长度、数据位宽、最高速率等本质上相当于设计参数,也可以认为是D2D接口的功能指标。

我们看到,多数D2D接口协议均支持标准封装和先进封装,少数协议仅支持先进封装。在标准封装下,典型的信道长度通常在50mm以下,数据位宽多为16线;而在先进封装下,信道长度仅为数个mm,而数据位宽通常会比标准封装大很多,典型值在32~64线之间。通常来说,D2D接口的最高数据率对标准封装和先进封装而言没有明显区分,一般在16~32Gbps之间。

真正考验D2D接口设计能力的是以下两个性能指标:时延(latency)和能效(power efficiency)。D2D接口的时延指标通常在几个ns,该指标决定数据传输的实际吞吐率,是直接影响系统性能的重要因素。D2D接口的能效指标一般在1pJ/b以下,先进封装下的这一数值还会进一步降低。由于D2D接口传输的数据率非常庞大,其功耗十分可观,甚至在整个系统功耗中也往往占据了相当大的一部分,因此能效对于D2D接口而言同样是一个至关重要的指标。

出于对系统性能的考量(换言之对D2D接口时延和能效性能的考量),我们将进一步审视D2D接口设计参数的选取。首先,为确保系统所需要的带宽,我们通常认为更高的数据率是更好的选择,但是更高的数据率通常意味着更低的能效,甚至在特定情况下还会导致更大的时延。因此,在某些情况下,适当降低数据率,同时配合更大的数据位宽可能是一个更好的方案。当然,更大的数据位宽需要占据更大的芯片面积,此时设计者可能需要考虑采用更小的凸点节距,甚至采用先进封装等更为复杂的方案来缩小接口电路的面积。从上述分析中可以看到,D2D接口电路的设计参数选取本质上仍是性能与成本的折中,如何实现有限成本(芯片面积,研发周期等)下的时延、能效最优化是D2D接口设计者始终思考的问题。

在上述考量下,总结来说,对于标准封装的D2D接口,较优的设计选择是采用最大的数据率和较小的数据位宽来实现带宽和面积的平衡;而对于先进封装的D2D接口,较优的设计选择是采用适中的数据率和较大的数据位宽,从而在确保带宽需求的情况下争取更好的能效性能。

上述分析虽然针对D2D标准封装和先进封装,对更为先进的3D封装也同样适用。在近期即将发布的UCIe 2.0中,协议定义了UCIe 3D接口的设计指标。在该指标中,接口的数据率进一步降低到4Gbps,以接近系统中逻辑电路的工作频率,从而实现极致的时延和能效性能;同时,协议通过指定较大的位宽和极小的节距以确保该接口的数据带宽和带宽密度。

D2D接口的设计思考

D2D接口的设计是一项系统而又细致的工作,其中最为困难从而也是最有价值的部分正是那些可以提升D2D接口性能的设计方法。如上所述,时延和能效是D2D接口最为重要的性能指标,下面我们就从这两个方面浅谈D2D接口设计的一些思考。

一、时延

以设计方法和流程而言,D2D接口电路通常都可以分为数字电路和模拟电路两部分。在D2D接口设计中,这两部分通常由不同的设计者来承担。自然地,设计者通常会从这两个部分去分别优化D2D接口的时延。比如,在数字电路设计中,尝试采用更高的工作频率和更精简的流水线结构等;同样,在模拟电路设计中也可以通过采用合理的串并转换电路结构来缩小时延。

然而,一个可能对时延影响更为显著却往往容易被忽视的环节是模拟电路和数字电路的接口部分。这是因为数字电路和模拟电路往往处在不同的时钟域中,而数据的跨时钟域传输需要经过同步。通常来说,设计人员一般会采用FIFO来对数据进行跨时钟域同步,这一过程将会带来数个时钟周期的时延。这一开销在大多数场景下无足轻重,但是对于D2D接口而言却可能是无法承受的。因此,如何处理数模接口上的数据同步问题是优化D2D接口延时的重要课题。

优化数模接口上的时延的中心思想是在完成数据同步的基础上缩小甚至取消FIFO所带来的时延开销。对此,我们提供了两种可行的方案:边沿调整技术和FIFO重置技术。边沿调整技术将数据的跨时钟域操作视为一次数据采样,其核心思想是通过调整算法搜索到最优的采样窗口对数据进行采样,从而完成跨时钟域操作,该方案可以将时延开销由数个时钟周期减小到半个时钟周期。FIFO重置技术是将FIFO从数模接口转移到模拟电路内部的串行时钟域上,假设模拟电路中的串并转换比为N,该方法可以将时延开销减小到原始方案的N分之一。

二、能效
能效优化所涉及内容则更为广泛,大到整个D2D接口架构的选取,小到某个具体电路的实现,都可能与最终的能效特性有密不可分的联系。这里我们将选取两个典型的例子来讨论基于能效优化的一些设计实现方法。

D2D接口的时钟方案是D2D接口架构设计的一个重要内容。通常对于16~32Gbps数据率的接口设计而言,半速率架构是一个较为常用的选择,因其结构简明且性能鲁棒。但是对于D2D接口,尤其是工作在较高数据率的D2D接口,半速率架构对于能效性能而言可能不是一个最优方案。因为D2D接口的数据位宽通常较大,这意味着D2D接口的片上时钟分布网络较传统的高速接口电路远为庞大,较高的时钟频率带来的时钟分布网络的功耗开销将变得十分可观。因此,对于工作在较高数据率的D2D接口来说,采用四分之一时钟速率架构或是一个对能效性能更加友好的方案。

从具体的电路设计角度,去偏斜(de-skew)电路是D2D接口中一个非常重要的模块,同时也是与整个接口的能效特性关系非常紧密的模块。去偏斜电路的作用是调节D2D接口中每个通道的时延,从而将所有通道输出信号的时间偏差限制在极小的范围内。对于去偏斜电路的设计,延时链结构是一个常用的选择。但是当该模块需要覆盖较大的偏斜时,延时链结构需要引入较大的延时,这同时也会带来较大的功耗。因此,出于能效的考量,基于相位内插器(PI)的电路结构可能是更适合D2D接口的电路实现方案。

D2D接口的设计流程革新

D2D接口作为一种新兴的高速接口,表现出很多不同于传统高速接口的技术特点,而这些新的特点也对传统的IC设计流程提出了挑战。由上面讨论可以看到,D2D接口是少数对数字电路、模拟电路和封装都有极高设计要求的系统,而D2D接口设计对设计方法和流程的挑战则主要集中在数字电路与模拟电路、芯片与封装的界面衔接上。

对于数字电路和模拟电路界面,传统的设计方法在设计流程上通常只对数字电路进行时序约束和分析,在模拟电路侧,一般仅通过仿真确保数模接口界面的时序。对传统的高速接口而言,这样的流程通常就可以满足设计需求,而对于D2D高速接口,由于其大带宽和低延时特性,其数模接口工作在更高的频率,传统的设计流程已然难以满足数模接口界面的时序要求。因此,在D2D接口设计的过程中,设计人员还需要在模拟电路侧应用时序约束和分析流程,包括刻画模拟电路边界处器件的时序特性、对其编写约束条件,并整合到数字电路的时序分析流程中进行统一的时序优化和收敛。

对于芯片和封装的界面的处理则主要集中在信道建模问题上。在传统的高速接口电路设计流程中,封装设计人员通常对信道进行单独建模,通过电磁场仿真,提取信道的仿真模型(如S参数模型),并提供给电路设计者进行仿真验证。在D2D接口设计中,尤其是先进封装甚至是3D封装下的D2D接口,较传统的高速接口有两个显著的区别:一是端口数量显著增加,二是信道条件更加规则,各端口往往面对较为简单且一致的信道条件。在第一个变化下,传统的设计流程将消耗大量的设计资源,使设计工作变得低效;而第二个变化则为信道的统一建模提供了机会。在先进封装尤其是3D封装下,对信道建立集总器件的简单模型,并转化为线延时融合到电路时序分析的流程中实现全链路的时序优化将成为一种高效的主流设计方法。

作者介绍:

王彧博士,奇异摩尔集成电路设计有限公司高级设计经理,近十年半导体产业经验,主要研究领域为高速互联接口集成电路设计,设计并量产PCIe、DDR、MIPI等多种高速接口,在ISSCC、JSSC、TCAS等集成电路设计会议和期刊上发表论文十余篇,申请和授权国内外专利6项。


关于奇异摩尔

奇异摩尔-AI网络全栈式互联架构产品及解决方案提供商

成立于 2021 年初,奇异摩尔以互联为中心,依托Chiplet和高性能RDMA技术, 构建统一互联架构 Kiwi Fabric,为超大规模AI计算平台提供高性能互联解决方案。
奇异摩尔的核心产品涵盖,面向北向Scale out网络的AI原生智能网卡,面向南向Scale up网络的片间加速芯粒RDMA G2G,面向高性能芯片算力扩展的Chiplet互联芯粒2.5D/3D IO Die,及UCIe Die2Die IP等全链路解决方案。我们的核心团队均来自全球半导体行业巨头,如NXP, Intel, Broadcom, Alchip, AMD, NCAP等,具有丰富的AI互联产品研发和管理经验。团队具有50+高性能网络及Chiplet量产项目经验。
奇异摩尔以创新为核心驱动、以技术探索新场景、以生态构建新的半导体格局、为高性能AI计算奠定稳固的基石。
来源:新机器视觉


申明:感谢原创作者的辛勤付出。本号转载的文章均会在文中注明,若遇到版权问题请联系我们处理。


 

----与智者为伍 为创新赋能----


【说明】欢迎企业和个人洽谈合作,投稿发文。欢迎联系我们
诚招运营合伙人 ,对新媒体感兴趣,对光电产业和行业感兴趣。非常有意者通过以下方式联我们!条件待遇面谈
投稿丨合作丨咨询

联系邮箱:uestcwxd@126.com

QQ:493826566



评论 (0)
  • 2024年10月12日  Global Info Research行业调研机构发布的《全球线性压电平台行业总体规模、主要厂商及IPO上市调研报告,2024-2030》分析了全球线性压电平台总体规模,主要地区规模,主要企业规模和份额,主要产品分类规模,下游主要应用规模等。统计维度包括收入和市场份额等。不仅全面分析全球范围内主要企业竞争态势,收入和市场份额等。同时也重点分析全球市场主要厂商(品牌)产品特点、产品规格、收入、毛利率及市场份额、及发展动态。历史数据为2019至2023年,预测数
    GIRtina 2024-10-12 11:31 128浏览
  •  在很多的应用场景都有电池供电,同时也有充电器同时存在的场景,这种供电系统希望在没有充电器的时候,为了保证充电头不带电就需要防止电流倒灌的产品比如肖特基或者是理想二极管,通常在小电流情况下比如1A以及一下的场景,肖特基便宜,不在乎功耗,但是当充电电流比较大的时候,肖特基压降明显的降低了效率,产生了很大的热损耗,给工程师散热造成了很大的挑战,这时候就需要用到理想二极管。无锡明芯微提供了多种选择的理想二极管控制和模块,覆盖不同的电压需求。 当有充电器在的时候,为了不让电池供电,提高电池的使
    王萌 2024-10-12 14:34 239浏览
  • 2024年10月14日  Global Info Research行业调研机构发布的《全球工业多级油雾收集器行业总体规模、主要厂商及IPO上市调研报告,2024-2030》分析了全球工业多级油雾收集器总体规模,主要地区规模,主要企业规模和份额,主要产品分类规模,下游主要应用规模等。统计维度包括收入和市场份额等。不仅全面分析全球范围内主要企业竞争态势,收入和市场份额等。同时也重点分析全球市场主要厂商(品牌)产品特点、产品规格、收入、毛利率及市场份额、及发展动态。历史数据为2019至202
    GIRtina 2024-10-14 13:36 95浏览
  • 10月12日,钱塘江畔,「极」系列高性能电摩迎来首发。作为首款「天能INSIDE」车型,「极」系列由天能与五星钻豹联合打造,搭载天能微纳铅碳大动力电池,在动力、续航及充电速率等方面展露出越级表现。动力性能领先单只电池多12片极板:采用高密度集群技术,通过矩阵式集群结构设计,帮助电池在空间不增加的情况下,装入更多极板,扩大活性物质反应面积,动力性能较同型号普通电池提升30%。电摩也能“涡轮增压”:微纳铅碳关键技术的应用,相当于在电池内部添加了法拉第-超级电容双功能内混型铅碳负极,使电池兼具超级电容
    电子资讯报 2024-10-14 14:50 98浏览
  •         手动探针台、半自动探针台和全自动探针台是三种不同类型的探针台,它们在使用类型、功能、操作方式和价格等方面都有所不同。        手动探针台是一种手动控制的探针台,通常用于没有很多待测器件需要测量或数据需要收集的情况下。该类探针台的优点是灵活、可变性高,易于配置环境和转换测试环境,并且不需要涉及额外培训和设置时间的电子设备、PC或软件。手动探针台系统只需要少量的培训,因此非常适合研发人员使用。&nb
    锦正茂科技 2024-10-14 13:05 76浏览
  • 在现代社会,不间断电源(UPS)系统已成为保障关键设备和数据安全的关键设施,广泛应用于企业数据中心、家庭电子设备等场景。UPS能在电力中断或波动时提供稳定电力,确保设备持续运行。而在这套系统中,光耦(光电耦合器)作为核心组件,发挥着至关重要的作用。光耦在UPS中的核心价值电气隔离,保障安全:UPS系统中,直流电源与交流负载间需实现良好的电气隔离。光耦能有效隔离高压与低压电路,防止高电压损坏控制电路,特别是在电源故障或短路时,更能保护敏感设备和系统,提升整体安全性。信号传输精准:UPS需实时监测电
    晶台光耦 2024-10-14 10:08 68浏览
  • 晶体管光耦是一种常用的光电耦合器,用于隔离和传输电信号,它包含有光电发射管和接收晶体管两个主要部分。解读晶体管光耦的主要指标有助于了解其性能和应用范围,主要指标包括:最大工作电压(V_R_MAX):这是发射管能够承受的最大工作电压,超过该电压会导致器件损坏。最大工作电流(I_F_MAX):这是发射管的最大工作电流,超过该电流可能会导致器件过载或损坏。电流传输比(CTR,Current Transfer Ratio):传输比指的是输出电流与输入电流之比,通常以百分比(%)表示。传输比越高,表示光电
    晶台光耦 2024-10-15 14:10 60浏览
  • 本文介绍瑞芯微RK3562/RK3568在Android11系统OTA(U盘/TF卡)升级固件方法,使用的是触觉智能的Purple Pi OH鸿蒙开源主板,搭载了瑞芯微RK3566芯片,类树莓派设计,是Laval官方社区主荐的一款鸿蒙开发主板。1、OTA包生成在源码根目录上执行以下命令编译OTA包# make installclean# make -j4# make otapackage -j4根编译成功后会在out/target/product/rk3566_r/目录下生成rk3566_r-o
    Industio_触觉智能 2024-10-12 13:11 86浏览
  • 在SMT贴片加工时,可能会出现焊接不良现象,这些现象会影响焊接工艺品质,最直观的表现就是产品品质下降,所以要对这类现象分析,并加以解决。下面就由贴片加工厂_安徽英特丽小编为大家分析一下焊接时出现焊点拉尖现象吧,一起看下去吧。 一、PCBA焊点拉尖的含义 焊点拉尖是指PCB板在进行焊接加工后,焊盘上的焊点上有明显的尖锐突出,这种现象被叫做焊点拉尖。 二、PCBA焊点拉尖的原因 1、手工焊接时:烙铁头的温度过低,导致锡丝受热不足,表现为可以融化但是不能够湿润焊点; 在焊料融化后未完全固化后过早地
    贴片加工小安 2024-10-14 15:55 97浏览
  •     电容器是四大基本元件之一。从低频到高频,电容器都扮演重要角色。高中物理不讲电容器,要到了大学在电工学或者模电这样的基础课上才开始接触。我认为对电容器的了解程度可以判断一个工程师的知识、经验水平。    根据GJB 8118的分类法,电容器分类如下:    工作中会混合上面的分类法,把电容器分为陶瓷电容、电解电容、膜电容等。下面分别介绍。 陶瓷电容器 Ceramic Capacitor    陶瓷电容
    电子知识打边炉 2024-10-14 22:56 57浏览
  • 概述 Altera被Intel收购后,开发软件改名叫“Quartus Prime”,且分两个分支,一个叫Standard(即标准版),另一个叫Pro(即专业版)。官网下载基于Cyclone 10 GX的PCIe参考设计,需要使用专业版,这些参考设计和资料如图1所示。图1:从官网下载到的资料与参考设计 依据提示,双击图1中的.par文件,Quartus就会启动并打开该项目,如图2所示。不过问题是双击后自动启动的Quartus的是当前电脑中安装的标准版。标准版不支持10代GX器件,所以这样打开是行不
    coyoo 2024-10-14 14:10 75浏览
  • 10月12日,以“技术引领筑生态,万物智联创未来”为主题的第三届OpenHarmony技术大会(以下简称“大会”)在上海成功举办。本次大会由OpenHarmony项目群技术指导委员会(TSC)主办,华为、上海交通大学、中国科学院软件研究所等单位支持,邀请了来自全球的开源操作系统技术领袖、前沿实践专家、广大开发者以及学术界大咖,面向全球展示了OpenHarmony的最新技术、生态、人才进展与行业实践,同时探讨了开源生态未来发展方向以及万物智联时代下操作系统的演进趋势,为下一代操作系统发展指明了前进
    Industio_触觉智能 2024-10-15 09:12 60浏览
  • 1.  背景、挑战与业界进展1.1. 虚拟化技术背景在云计算的浪潮中,虚拟化技术扮演着举足轻重的角色。它通过将物理机集群的资源进行抽象整合,构建出一个统一的虚拟资源池。在这个资源池中,每一台物理机上都会运行宿主机以及虚拟化的系统软件。这些系统软件负责为用户提供虚拟的计算环境,包括虚拟CPU、虚拟内存、虚拟网络等,都是由Hypervisor这一核心组件来实现的。Hypervisor不仅确保了虚拟机计算能力的平稳性和弹性,还为用户提供了灵活的资源调度和分配能力。虚拟化技术在云数据中心、大数
    Yusur_Tech 2024-10-14 14:58 107浏览
  • 在当今快速发展的自动驾驶技术领域,传感器的作用日益凸显,它们是实现车辆环境感知的基石。其中,毫米波雷达因其独特的优势,已成为自动驾驶传感器套件中不可或缺的一部分。这种雷达不仅能够在各种恶劣的天气条件下稳定工作,还能提供精确的距离和速度信息,这对于车辆的安全导航至关重要。一、毫米波雷达概述RADAR(RAdio Dectecting And Ranging)是指利用毫米波信号(30-300GHz)来探测和测量目标的雷达系统,其中毫米波是微波的一个子频段。在汽车领域,使用的毫米波雷达主要在24GHz
    康谋 2024-10-15 10:36 118浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦