光进入芯片,能为高性能计算带来什么?

传感器技术 2023-05-12 07:06


导读:硅光子学进步的推动下,深度光子学集成已经在某些数据中心应用中证明了可行性,CPO架构肯定会在数据通信之外的领域继续它的故事。  


GPT爆火,算力“芯慌”,而数据中心HPC的功率效率也备受关注,据称共封装器件(CPO,Co-packaged optics)能将功耗降低30%,每比特成本降低40%。真有这样的好事?条件成熟了吗?我们往下看。


CPO市场预期如何?


CPO是将交换芯片和光引擎共同组装在同一个插槽上,形成芯片和模组的共封装。这样就可以尽可能降低网络设备的工作功耗及散热功耗,在OIF(光互联网络论坛)的主导下,业界多家厂商才共同推出了近CPO器件(NPO)和CPO技术。


共封装方法横截面


根据Yole预测,伴随未来人工智能(AI)的发展,数据通信光学器件一直在增长,2022-2028年其CAGR将为24%,2028-2033为80%,收入预计将从2022年的3800万美元增长到2033年的26亿美元。得益于AI/ML设备数据移动的加速,2022-2033年CAGR为46%。其中CPO将从2022年的600万美元增长到2033年的2.87亿美元,CAGR为69%。


2022-2033年数据通信光学收入增长预测


2023年,GPT引发了驱动力和应用范式的转变。高带宽、每机架高功率预算、HPC新型光链路捉襟见肘。随着从联网(交换)到处理(AI/ML(机器学习))的范式转变,预计2024年将推出首个基于光学I/O的封装内Al系统,而CPO的批量交付预计将在2029年之后。


2023年驱动力和应用范式转变


 

CPO为何能受到青睐?


CPO受到关注是由于其在数据中心高性能计算的功率效率。由于近来宏观经济不利,网络应用CPO的大多数支持者已暂停了对CPO项目的支持。其主要原因包括:一是可插拔产品的工业生态系统需要完善;二是可插拔尺寸的集成电光调制器可以实现所需的低功耗,且可在不改变现有网络系统设计的情况下引入市场。


Yole Intelligence光子学和传感部门高级分析师Martin Vallo博士则表示:“在所需的电密度和光密度、热管理和能源效率方面,可插拔尺寸将限制其支持6.4T和12.8T容量的能力,使用硅光子学技术平台的共封装能够克服上述挑战。”


随着技术进步,能够在商业系统中更紧密地集成通信和计算技术的网络硬件组件越来越常见。不过,CPO对AI/ML系统仍保持着吸引力。AI模型的规模正在以前所未有的速度增长,传统架构(铜基电互连)的芯片对芯片或板对板能力将成为扩展ML的主要瓶颈。因此,HPC及其新的分散架构出现了新的、非常短的光互连。分散设计将服务器卡上的计算、内存和存储组件分开,并分别对其进行池化。


通过先进的封装内光学I/O技术将基于光学的互连用于xPU(CPU、DPU、GPU、TPU、FPGA和ASIC)、内存和存储器,以实现必要的传输速度和带宽。


此外,未来数十亿光学互连(芯片、电路板)的潜力正在推动大型代工厂为大规模生产做准备。由于大多数光子制造IP由非代工公司(AyarLabs、Ranovus、思科、Nvidia、Marvell、Lightmatter和许多其他公司)持有,Tower Semiconductor、GlobalFoundries、ASE Group、台积电和三星等大型代工公司正在准备硅光子工艺流程,以接受设计公司的任何PIC架构。所有这些代工厂都在加入PCIe、CXL和UCIe等行业联盟。


小芯片(chiplet)互连的通用规范允许构建超过最大掩模尺寸的大型片上系统(SoC)封装。这有助于在同一封装内混合来自不同供应商的组件,并通过使用较小的片芯来提高制造产量。每个小芯片可以使用适合特定器件类型或计算性能/功耗要求的不同硅制造工艺。


2023年优选CPO参与者供应链


对快速增长的训练数据集的预测表明,数据将成为扩展ML模型的主要瓶颈,因此,AI的进展可能会放缓。在AI/ML设备中加速数据移动是下一代HPC系统采用光学互连的主要驱动因素,在ML硬件中使用光学I/O有助于应对数据的爆炸性增长。


 

怎样重拾CPO?


事实上,在过去50年里,每十年都会有一次移动技术创新。移动带宽需求已经从语音通话和短信发展到超高清(UHD)视频和各种增强现实/虚拟现实(AR/VR)应用。尽管疫情对电信基础设施供应链产生了很大影响,但全球消费者和商业用户不断对网络和云服务产生新的需求。社交网络、商务会议、UHD视频流、电子商务和游戏应用将继续推动增长。


每个家庭和人均连接到互联网的设备数量正在增加。随着功能和智能不断增强的新型数字设备的出现,每年的采用率都在上升。此外,不断扩展的机器对机器应用,如智能电表、视频监控、医疗保健监控、连接驱动器和自动化物流,极大地促进了设备和连接的增长,并推动了数据中心基础设施的扩张。


由于预算削减,CPO社区面临困难时期,只有在可插拔设备精疲力竭时CPO的全面部署才会发生。至少在接下来两代交换机系统中,CPO很难与可插拔模块竞争,在很长一段时间内可插拔模块仍将是首选。由于在数据中心中的网络功率效率,CPO最近受到了很多关注。思科、脸书/Meta、IBM、英特尔和微软等行业重量级公司一直在努力推动CPO;博通、GlobalFoundries、Marvell、Quanta Cloud Technology等公司也加入了进来。


分析表明,与数据中心总功耗相比,联网节省的功耗可以忽略不计。只有博通、英特尔、Marvell和其他一些CPO公司会将专有解决方案推向市场。


随着6.4T光学模块最晚在2029年到来,CPO和可插拔光学器件之间可能发生激烈的竞争,预计CPO系统中的多个技术障碍将在此时得到解决。不过,收发器行业正在不断创新,以推动可插拔光学器件市场。在CPO系统实现网络应用的批量交付之前,将在可插拔设备中使用CPO方法,且光学引擎将在高性能计算的未来系统中越来越受欢迎。行业生态系统,包括Ayar Labs、Intel、Ranovus、Lightmatter、AMD、GlobalFoundries和其他围绕机器学习(ML)系统供应商Nvidia和HPE,已经取得了相当大的进展,计划在2024年至2026年间批量交付产品。


光子集成电路可以实现高功率和成本效益的光学互连CPO,可以预计,800G和1.6T可插拔模块将备受欢迎,因为它们具有100G和200G单波长光学器件的优势,因此可以在QSFP-DD和OSFP-XD尺寸中实现技术和成本效益。


光纤距离芯片组也越来越近,用光将数据引入到集中处理点是架构设计师的主要目标之一。这一趋势始于十年前安装在PCB上的光学组件专有设计。这些嵌入式光学互连(EOI)的想法在板载光学联盟(COBO)中得到了延续,其制定的规范允许在网络设备制造中使用板载光学模块。


CPO是一种创新方法,可以将光学器件和交换机ASIC紧密结合在一起。由于在50T交换芯片中使用16个3.2Tbps光学模块是当今技术的挑战,NPO通过使用高性能PCB基板(一种内插器)解决了这一问题。NPO内插器更宽,使芯片和光学模块之间的信号路由更容易,同时仍能满足信号完整性要求。相比之下,CPO能以更低的信道损耗和更低功耗使模块和主机ASIC更接近。


 

运营商喜欢怎样的方案?


如今,光可插拔模块市场供应链已经建立完善,包括分立或集成组件供应商、生产发射器和接收器光学组件(TOSA和ROSA)、多路复用器、DSP和PCB的光学公司以及组装/测试集成商。此外,一个交换机盒中多个不同可插拔模块的互操作性有助于行业的灵活性。高度集成的光学器件和硅片非常需要新的工程能力和代工厂,这对于传统的中型企业来说是不可接受的。只有价值数十亿美元的光学供应商才能负担得起从可插拔产品转向CPO的费用。


需要指出的是,尽管主流部署了主要针对大型云运营商的CPO解决方案,但仍有许多小型企业数据中心没有采用最新的互连技术。这意味着,即使CPO成为主流技术,可插拔模块仍将对CPO在技术或经济上不可行的几个应用(如长途应用和边缘数据中心)有很高的需求。预计可插拔技术在未来10年内不会逐步淘汰。不过,可插拔光学行业可能会整合,而CPO市场将形成多供应商商业模式。


市场调研公司CIR表示,数据中心CPO的部署将在很大程度上受到交换演进的驱动,到2025年,将达到102.4Tbps。CIR表示,与使用可插拔光学器件相比,CPO可以将功耗降低30%,每比特的成本降低40%。


在组件层面,与前板可插拔产品(FPP)相比,CPO具有潜在的经济效益。例如,正如Ranovus董事长兼CEO Hamid Arabzadeh所说:成本是一个关键因素,因为不需要PAM4 IC定时器,“不需要时钟和数据恢复(CDR)芯片和其他FPP项目也可能带来节约。”


串行器和解串器(SerDes)链路是CPO的热门话题。Martin Vallo博士认为,224Gbps数据速率的标准化SerDes链路是使CPO成为主流的必备条件之一,可以通过多种链路类型提供信号,包括片对片(D2D)、芯片到芯片、芯片到模块(C2M)、中距离芯片到芯片(MR)和长距离芯片到片(LR)。


FPP和CPO部署模型的比较


与此同时,思科和OIF成员Jock Bovington强调,共封装的好处之一是降低整体功耗。“采用共封装时——无论是在同一基板(CPO)上还是在高密度中间层(HDI)基板(NPO)上——通道的损耗都会大大减少,能够使用明显更低功耗的SerDes,如XSR(10dB)或XSR+(13dB)。OIF开发了两种类型的电气接口。”


写在最后


2020年,开始出现了第一批CPO概念验证并创建了规范。四大超大型云运营商中的两家——Meta和微软——积极支持CPO渗透到其云网络中。


2022年,交付了数千台CPO引擎进行试点测试。今年,尽管遇到一些宏观经济逆风,将对预算密集型项目产生负面影响,但在硅光子学进步的推动下,深度光子学集成已经在某些数据中心应用中证明了可行性。CPO架构也肯定会在数据通信之外的领域继续它的故事。


- END -

 

  

免责声明:本文版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权并按国家标准支付稿酬或立即删除内容!本文内容为原作者观点,并不代表本公众号赞同其观点和对其真实性负责。 

  

 

为您发布产品,请点击“阅读原文”

 

传感器技术 制造业的未来是智能化,智能化的基础就是传感器; 互联网的方向是物联网,物联网的基石也是传感器; 关注传感器技术,获得技术资讯、产品应用、市场机会,掌握最黑科技,为中国工业导航。
评论 (0)
  • 用 Raspberry Pi 打造安全的能源服务物联网基础设施,创造更可持续的未来。EpiSensor 采用 Raspberry Pi Compute Module 4 为能源服务创建物联网基础设施层,帮助加快全球可持续能源转型。未来几年,数以百万计的能源消耗和生产设备将连接到互联网,以实现新能源经济并促进向可持续能源的快速过渡。传统的计量、控制和自动化系统从来都不是为了解决这个问题而设计的——它们需要高水平的技术专业知识才能部署,而且过于复杂和昂贵——拖慢了能源服务公司的发展速度。E
    树莓派开发者 2024-04-18 18:08 167浏览
  • 基于Cyclone V GX FPGA的TDC设计及测试结果分析概述       基于老工艺的FPGA的TDC已经经过验证测试,可以安全可靠的用于产品。在逻辑资源受限的情况下,单通道TDC测量精度可以做到15ps左右,如果给予足够资源的情况下可以进一步提升精度。 之前已经分析了28nm器件逻辑资源的结构,与老工艺器件还是有些差别,如果应用这种工艺器件来实现TDC是否可以从老器件无缝移植过来呢?这是本文需要探讨的问题。新老工艺相对TDC设计的不同挑战&nbs
    coyoo 2024-04-20 10:41 315浏览
  • 来源:虹科汽车电子 虹科干货丨轻松掌握PCAN-Explorer 6,dll调用一文打尽!原文链接:https://mp.weixin.qq.com/s/ShG8B7-iUJ9OokOHSNBX2Q欢迎关注虹科,为您提供最新资讯!#CAN #CAN FD #dll调用导读虹科PCAN-Explorer 6(下称“PE6”)作为一款专业的CAN/CAN FD网络处理软件,不仅提供了强大的报文监控和发送功能,还通过其创新的dll加载功能,为用户带来了更加灵活和高效的批量逻辑操作体验。本文将详细介绍如
    虹科电子科技 2024-04-19 10:39 158浏览
  • 随着科技的不断进步,汽车行业也在经历着一场革命性的变革。智能汽车技术的发展,尤其是车联网技术的应用,正在改变我们对汽车的认知和使用方式。在这一背景下,比亚迪E3作为一款新能源汽车,其在驾校领域的CAN数据应用,不仅提升了教学效率,还为驾驶培训带来了前所未有的安全性和便捷性。 一、比亚迪CAN数据系统CAN(Controller Area Network)即控制器局域网络,是一种用于汽车内部通信的网络协议,它能够实现车辆各个电子控制单元之间的信息交换。比亚迪E3通过CAN数据系统,能够实
    lauguo2013 2024-04-19 10:11 174浏览
  • 来源:虹科汽车电子 虹科技术丨全新Linux环境PCAN驱动程序发布!CAN/CAN FD通信体验全面升级!原文链接:https://mp.weixin.qq.com/s/4RXqjUa_odEaxAhcfQOHaA欢迎关注虹科,为您提供最新资讯!#PCAN #Linux #CAN导读全新8.17.0版本的PCAN-Linux驱动程序正式发布,专为CAN和CAN FD接口量身打造。无论是CAN 2.0 a/b还是CAN FD的PCAN硬件产品,都能在我们的新驱动下“驰骋自如”。想要体验字符模式设
    虹科电子科技 2024-04-19 10:43 167浏览
  • PAVELINK.SOA-Converter转换工具,用于衔接基于SOA的控制器设计、开发及测试过程中所常见的各类软件工具。PAVELINK.SOA-Converter能提供IDL及服务矩阵等文件的语法及规则检查,自动化完成多种不同格式IDL文件之间的转换,以及其它常用的各类型格式文件转换。PAVELINK.SOA-Converter支持多种行业主流研发工具所使用的IDL,如FIDL、OMG IDL、ROS2 Msg、Protobuf、vCDL等,并对AUTOSAR CP/AP平台模型文件、总线
    北汇信息 2024-04-19 09:44 163浏览
  • QII17.0添加器件库概述        安装Quartus II的时候为了节省硬盘空间,有时候会有选择地只安装自己用的器件,所以当有新的项目用到了其它未安装库的器件的时候就需要手动额外给Quartus II添加器件库。开始接触10代产品后,我们的QII开发软件是从版本17开始,因为我们手上有用到StratixIVGX器件,版本17当时是可以兼容的。这里还是要吐槽一下Intel收购ALTERA后对于开发软件做出的规划,即将软件区分为标准版和专业版,比如我
    coyoo 2024-04-20 13:37 263浏览
  • 科技云报道原创。OpenAI“宫斗”大戏即将尘埃落定。自首席执行官Sam Altman突然被董事会宣布遭解雇、董事长兼总裁Greg Brockman辞职;紧接着OpenAI员工以辞职威胁董事会要求Altman回归;再到OpenAI董事会更换成员、Altman回归OpenAI。表面上看,这似乎是一场针对一家独领风骚的技术初创公司控制权的争夺战,但从种种迹象来看,此次“宫斗”的导火索,更多应源自对AI未来发展理念的分歧:一派扛着“加速主义”旗帜,希望AI在技术精英的带领下加速前进改造世界;另一边则是
    科技云报到 2024-04-19 11:21 206浏览
  •       伴随着汽车与外界的交互手段不断丰富,车联网相关设备、系统间的数据交互更加频繁,万物互联下的网络攻击也逐渐渗透延伸到车联网的领域。汽车行业面临着重大的信息安全挑战。此外,UNECE WP.29 R155和ISO/SAE 21434标准也对汽车的信息安全提出了规范化的要求,旨在产品全生命周期中,分阶段将信息安全威胁导致的风险降低到合理的范围,汽车信息安全不容忽视。      经纬恒润针对ISO/SAE 21434、WP.29 R
    经纬恒润 2024-04-19 11:57 169浏览
  • 电子产品上的连接器扮演着重要的角色,它们在整个装置中负责着连接电路并传输讯号的关键功能,可谓是装置内部结构不可或缺之一。这些连接器的性能和质量直接影响着整体系统的运作效能,因此在设计和制造过程中对于这些组件的选择相当重要。在众多连接器的组件中,接触件更是其中的核心零件,其作用类似于系统的桥梁,负责确保电流的顺畅传输和信号的稳定传递。这些接触件的设计和制造必须考虑到各种环境因素,例如:温度变化、湿度、振动等,以确保其在各种条件下都能够保持稳定的性能。潜在风险当电子产品受到振动时,接触件可能会面临以
    百佳泰测试实验室 2024-04-18 17:05 163浏览
  •     功率器件的使用寿命(MTTF,Mean Time to Fail)制约着执行器的整机寿命。功率MOSFET承受的电气应力、热应力甚至机械应力是普通电子器件不可比的,所以在功率MOSFET的失效机理研究领域已经有比较多的文献。JEDEC、JEITA等行业组织针对性地发布了功率器件的可靠性验证实验标准。    怎样估计功率MOSFET的使用寿命呢?    据我了解,目前用的是一种和普通电子元器件相同的两步法——寿命可靠性实验,基于卡
    电子知识打边炉 2024-04-20 11:17 294浏览
  • 各大Logo更新汇报 | NEW百佳泰为ISO/IEC17025实验室,亦获得国际协会授权,可提供超过30种标准认证测试,特为您整理2024年4月各大Logo的最新规格信息。Bluetooth▶蓝牙取证资格新流程■ https://www.bluetooth.com/download/qprd-document/▶In-Person UPF■ 美国Bellevue, 2024/9/9~2024/9/12▶IOP测试活动■ 德国慕尼黑, 2024/4/8~2024/4/12PCIe▶PCI-SIG
    百佳泰测试实验室 2024-04-18 16:40 111浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦