广告

7nm惊世之作如何成就800G核心网时代?

时间:2020-03-19 作者:邵乐峰 阅读:
作为目前业界带宽最高、计算密度最高的自适应平台,赛灵思最新推出的Versal Premium系列可提供比当前主流FPGA高3倍的吞吐量和2倍的计算密度,它是如何做到的?性能如此之高的产品,会不会因为昂贵的价格限制了市场的应用规模?
广告
ASPENCORE

自适应计算加速平台(ACAP)是赛灵思(Xilinx)在2018年推出的一个高度集成的多核异构计算平台,能根据各种应用与工作负载的需求从硬件层对其进行灵活修改。ACAP历经四年研发,累积研发投资逾10亿美元,超过1500名软硬件工程师参与其中,公司上下对其寄予了极高的期望。Q7YEETC-电子工程专辑

赛灵思CEO Victor Peng此前在接受媒体采访时称,虽然FPGA与Zynq SoC技术当前仍然是公司业务的核心,但赛灵思今后将不再仅仅是一家FPGA企业,尤其是伴随着ACAP的发明,赛灵思在当前以及未来将为数据中心与主流市场创造更多新的价值。Q7YEETC-电子工程专辑

ACAP首款产品Versal的名字来源于两个词,一个是多样性,一个是通用性。产品组合包括Versal基础系列(Versal Prime)、Versal旗舰系列(Versal Premium)系列和HBM系列。此外,还包括AI核心系列(AI Core)、AI边缘系列(AI Edge)和AI射频系列(AI RF)。率先亮相的Prime系列和AI Core系列已于2019年下半年实现全面供货,而最新推出的Versal Premium系列,则是目前业界带宽最高、计算密度最高的自适应平台。Q7YEETC-电子工程专辑

Versal Premium的硬核秘密

“目前无论是在数据中心还是在核心城域,每年带宽的年复合增长率都高达51%,那些来自视频流、企业、物联网和智能器件的数据是主要推动力。”赛灵思产品线营销与管理高级总监Sumit Shah说,随着5G时代的到来,带宽规模将会增长100倍以上,传统网络在以下三大方向上的变化将最为明显:首先是核心网扩展,5G核心年复合增长率预计为313%;其次,安全和分析成为网络运营商最关心的内容;第三,端口的密度和带宽呈几何级倍数增长,端口速度远超摩尔定律,传统器件已经跟不上计算密度的发展。Q7YEETC-电子工程专辑

Q7YEETC-电子工程专辑

赛灵思产品线营销与管理高级总监Sumit ShahQ7YEETC-电子工程专辑

在这一背景下,Versal Premium采用了台积电7nm工艺制造,系统逻辑单元从最小160万个到最高740万个,自适应引擎LUT数量从最低72万个到最高340万个,可提供比当前主流FPGA高3倍的吞吐量和2倍的计算密度,并内置以太网、Interlaken和加密引擎,专为在散热条件和空间受限的环境下运行最高带宽网络,以及那些需要可扩展、灵活应变应用加速的云提供商而设计。预计将于2021年上半年开始为早期用户提供样品。Q7YEETC-电子工程专辑

Q7YEETC-电子工程专辑

112Gbps PAM4收发器、数百GbE(千兆位以太网)和Interlaken连接、高速加密以及内置DMA、支持CCIX和CXL支持的PCIe Gen5是Versal Premium的新颖和独到之处。配合Vitis统一软件平台与Vivado设计套件,开发人员可以使用自己熟悉的框架和工具(TensorFlow、Caffe、PyTorch、Vitis、VIVADO)来进行开发。Q7YEETC-电子工程专辑

Q7YEETC-电子工程专辑

赛灵思高端ACAP与FPGA高级产品线经理Mike Thompson表示,Versal ACAP非常重要的差异化特点就是具有片上可编程网络。“传统高性能、高带宽的设计经常会遇到路径上的瓶颈,而片上可编程网络可以解决这个问题,可以在所有引擎之间、用户逻辑器件和连接界面之间实现通信,而无需额外资源。”他说。Q7YEETC-电子工程专辑

Q7YEETC-电子工程专辑

赛灵思高端ACAP与FPGA高级产品线经理Mike ThompsonQ7YEETC-电子工程专辑

  • 更快速、更安全的网络

Versal Premium系列提供了高达9Tb/s的可扩展、自适应串行带宽。具体方法是将112G PAM4收发器与集成的网络功能模块用于核心网、城域网和数据中心互联(DCI)基础设施,将每端口带宽密度提高两倍,并降低时延高达50%。Q7YEETC-电子工程专辑

这种预制连接可实现安全的多太位以太网(multi-terabit Ethernet),灵活支持各种数据速率与协议。通道化以太网硬核能够以最小占板空间提供高达5Tb/s的吞吐量,同时高速加密引擎可提供高达1.6Tb/s的加密线路速率吞吐量,并支持AES-GCM-256/128、MACsec和IPsec 。Q7YEETC-电子工程专辑

以5G市场为例,Mike Thompson说5G运营商目前使用的是Versal AI Core系列,到今年年底应该能够大规模生产。而核心网建设要比无线网的投资晚2-3年,所以高峰应该出现在2023年,对于一些想要通过部署最尖端的技术来占领市场份额的客户,现在用Versal Premium开始开发设计,正好能够赶上这一机遇。Q7YEETC-电子工程专辑

  • 灵活应变的云加速

通过将超过120TB/s的片上存储器带宽与可定制存储器层级相结合,Versal Premium能够减少数据移动从而消除相应的关键瓶颈,与此同时,还支持以嵌入式方式将预制连接与硬核集成到现有云基础设施中。从基因组学、数据分析和视频转码,到针对语音和图像识别的AI推断,Versal Premium 提供了高度集成的云就绪平台,为多元化的工作负载提供突破性能。   Q7YEETC-电子工程专辑

Q7YEETC-电子工程专辑

从基因组学、数据分析和视频转码,到针对语音和图像识别的AI推断,Versal Premium提供了高度集成的云就绪平台,为多元化的工作负载提供突破性能。具体到AI性能方面,Versal Premium系列在Yolov2(608×608)对象检测模型下,性能分别是英伟达V100和T4的4.6倍和7.7倍;在异常检测AI方面(随机森林算法),性能是英特尔Xeon的65倍。Q7YEETC-电子工程专辑

具体到Versal Premium系列,其高效的表现主要源自对应用处理器、实时处理器、平台控制器、存储器界面以及多种连接进行的丰富集成。在Mike Thompson看来,如果用软件逻辑去实现以太网Interlaken或加密引擎,需要很多FPGA资源才能实现。但Versal Premium采用的ASIC硬核方式大幅提升了效率,网络硬核IP集成提供了等效22个16nm FPGA的逻辑密度。这样的配置使得开发者能够更加专注于差异化,而无需分散精力在基础架构设计与连接上,同时可以帮助客户降低资本支出与运营成本。Q7YEETC-电子工程专辑

Q7YEETC-电子工程专辑

同时,Versal Premium在同一器件上提供32G、58G和112G收发器的广泛选择,允许厂商扩展主流100G系统、增加400G部署,并将自己定位为800G以上的厂商。Q7YEETC-电子工程专辑

值得注意的是,与前代Virtex UltraScale+ FPGA相比,Versal Premium功耗降低了60%。在数据中心的应用当中,与前代的FPGA相比可以提供2倍的带宽密度。这意味着,在带宽相同的情况下Versal Premium的机柜空间占用只有前代FPGA的一半,实现了加速功能的优化并大幅降低了总拥有成本。Q7YEETC-电子工程专辑

Q7YEETC-电子工程专辑

根据IHS Markit的研究显示,当前安全性已经成为了网络运营商最为关注的问题。Versal Premium ACAP提供1.6Tb/s的行速率加密吞吐量,因此是安全网络的理想平台。它在灵活应变的平台上采用业界唯一的硬化400G通道化高速加密 (HSC)引擎。HSC引擎支持AES-GCM加密/解密、MACsec和IPsec,可实现多层安全性。Q7YEETC-电子工程专辑

Q7YEETC-电子工程专辑

但性能如此之高的产品,会不会因为昂贵的价格限制了市场的应用规模? Mike Thompson对此回应称,包括电信、全域网、交通网、数据中心、测试测量在内的很多市场都对Versal Premium表现出了非常浓厚的兴趣,希望尽快拿到Versal Premium去进行前期测试。Q7YEETC-电子工程专辑

“但我必须要强调的是,Versal Premium是一款非常高端的产品,针对的目标群体是希望借此尽早部署最尖端、最先进的技术来获取市场份额的用户,而不是希望能够实现最低成本的客户。”他同时表示,考虑到目前芯片性能的增加和成本的降低,已经很难随着传统的摩尔定律逐步推进,所以Versal Premium具备的高集成度和灵活性将会给用户带来更多价值。Q7YEETC-电子工程专辑

ASPENCORE
本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
邵乐峰
ASPENCORE 中国区首席分析师。
  • 云计算将彻底改变电子设计 由于越来越多的问题将在云端解决,云计算将彻底改变电子设计。未来在选择处理器时的一个重要考虑因素将是,哪种处理器最容易支持从云端到嵌入式设备的实现。随着越来越多的嵌入式设备接入到IoT,什么计算应该在云端完成,什么计算应该在边缘完成,每个系统都必须从成本、速度、隐私等各个方面综合考虑。
  • 紧随苹果,三星也自研5nm工艺ARM桌面处理器 前不久苹果刚刚宣布未来Mac电脑将全部采用ARM架构的自研处理器,现在看来ARM平台有可能有新的入局者了。7月24日消息,据外媒报道称,继苹果之后,三星也可能入局自研ARM架构的桌面处理器领域,三星被传出正在研发Exynos 1000芯片,有可能用于即将推出的Windows PC。
  • 2020年5G手机:华为第一稳了,中国品牌占全球75% 目前推动5G商转属中国最为积极,观察其5G基站建设数量与网络的覆盖表现,皆位居全球之冠,也因此中国手机品牌针对5G手机超前部署,在2020上半年已囊括全球75%的市占率。
  • KLA推电子束缺陷检测系统,提高EUV工艺良品率 KLA公司宣布推出eSL10™电子束图案化晶圆缺陷检查系统。该系统具有独特的检测能力,能够检测出常规光学或其他电子束检测平台无法捕获的缺陷,从而加速了高性能逻辑和存储芯片的上市时间(包括那些依赖于极端紫外线(EUV)光刻技术的芯片)。
  • “星辰”处理器商用落地,地道中国CPU不受管制影响 安谋中国仅用了17个月,就推出了面向物联网设备的轻量级实时处理器“星辰”系列的第一个EAC版本,包含了团队/技术环境搭建、项目立项、高质量IP交付,这在Arm研发历史上几乎是没有的。
  • 折叠屏为何如此脆弱?揭秘柔性显示技术 因为折叠屏的脆弱属性,拉远了它与一般人的距离:当我们花两万块钱买台折叠屏手机,却需要在每天早晨,手机闹铃响起时,伸手去触碰屏幕还得先想一想是不是没剪指甲。这样的体验还是令人畏惧的。我们期望尝试通过这篇文章,从技术层面去探究,折叠屏手机为何如此脆弱,及从侧面呈现折叠屏手机当前的发展阶段。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了