广告

高宽带一致性能为异构加速带来什么?

时间:2019-09-25 作者:邵乐峰 阅读:
Stratix 10 DX的独特之处就在于它的高带宽与低延时……
广告

从Arria 10 GX,到Stratix 10 SX/TX、N3000,再到全新一代Agilex FPGA,英特尔在过去的18个月内,宣布了很多的FPGA可编程加速卡(PAC)平台解决方案,实现了对5G边缘/网络和数据中心服务器加速业务的全面覆盖。在此基础上,英特尔日前再度宣布出货全新Stratix 10 DX FPGA产品。zwPEETC-电子工程专辑

按照英特尔内部对产品的定位,GX系列属于面向众多市场的通用型产品,TX系列主要应用于高速网络,例如速度达到58Gbps每秒的以太网,而DX系列则主要针对与至强处理器服务器的连接。例如SX就专为内嵌处理和内存密集型工作负载而构建,如流分析和视频转码。而外形较小的采用Arria 10 FPGA的英特尔PAC适用于回溯测试、数据库加速和图像处理等工作负载。zwPEETC-电子工程专辑

VMware是此番英特尔Stratix 10 DX的合作伙伴之一,“与VMware的合作是英特尔市场进入策略中很重要的一部分。”但英特尔公司网络和自定义逻辑事业部副总裁兼FPGA和电源产品营销总经理Patrick Dorsey说,其实早在3个月前,英特尔就已经开始出货工程级样品设备与全套开发套件和API给包括中国在内的全球客户。zwPEETC-电子工程专辑

众所周知,FPGA在异构计算中具体有两种加速形式,即旁路加速和内建加速。旁路加速可以将重度计算功能转移到FPGA上,从而释放处理器去处理其他功能;而如果时延比较重要,则可以进行内建加速,从而通过FPGA的多功能性带来更好的网络存储和计算的加速。zwPEETC-电子工程专辑

而Stratix 10 DX的独特之处恰好就在于它的高带宽与低延时。作为英特尔首个支持超路径互连(UPI)和PCI-Express(PCIe) Gen4 x16的FPGA产品,Stratix 10 DX使至强处理器与FPGA无论采用傲腾还是DDR内存,均可实现存储共享,从而极大的扩展了系统内存,避免了数据迁移和拷贝带来的高成本,同时也提升了系统性能。zwPEETC-电子工程专辑

高宽带一致性能为异构加速带来什么?zwPEETC-电子工程专辑

这种存储扩展的效果是惊人的。数据显示,通过与特定的英特尔至强可扩展处理器组合,UPI接口可将延迟降低37%,并实现28GB/秒的理论峰值传输速率。而符合PCI-SIG标准的Gen4 x16接口则能够提供32GB/秒的理论峰值数据带宽,从而将数据中心和非数据中心应用的吞吐量大约将提高1倍以上。此外,内存控制器还支持8个独立的傲腾™ DC持久内存控制器,总容量可到4TB。zwPEETC-电子工程专辑

高宽带一致性能为异构加速带来什么?zwPEETC-电子工程专辑

Stratix 10 DX还非常适合从边缘到云端的高性能计算应用。在边缘计算应用方面,在AI或者是神经网络的计算任务上,要求应用进行超快速的响应。与仅仅使用PCIe的产品相比,Stratix 10 DX的响应速度快了37%。在网络应用当中,PCIe Gen4与前代相比提高了两倍带宽,这使得数据处理更为快速,同时也具有了以太网功能。在数据中心方面,通过英特尔的异构计算架构,即Xeon+FPGA组合,加之PCIe Gen4与UPI的互联,总带宽可以提升2.6倍。zwPEETC-电子工程专辑

目前,至强处理器和FPGA仍然是各自独立的器件通过接口连接,而非集成。当问到未来会不会有通过封装集成在一起的趋势时,Patrick对此回应说,集成是大趋势,但考虑到当前客户仍然偏好于保持灵活性以便于根据需求进行各种配置和优化,未必希望全部都集成封装起来,所以英特尔暂时没有相关计划。zwPEETC-电子工程专辑

在数据中心里作为CPU的硬件加速器,用来加速深度学习的模型训练、金融计算、网络功能卸载等各类应用,是当前FPGA的一个主要应用场景。但该领域亟待解决的核心问题之一,就是缓存一致性。换句话说,就是必须要明确CPU与硬件加速器之间的内存互联协议。zwPEETC-电子工程专辑

今年3月,英特尔宣布联合微软、阿里、思科、戴尔EMC、Facebook、谷歌、惠普企业HPE和华为等公司,共同推出一个全新的互联标准,取名为Compute Express Link(CXL),应用目标锁定互联网数据中心、通信基础设施、云计算与云服务等领域,而这也正是FPGA大显身手的重要平台。zwPEETC-电子工程专辑

Patrick强调称,UPI目前UPI是封闭的,只搭配至强处理器,但它为接下来完全公开的CXL路线图提供了新路径。基于英特尔技术,应用开发者、系统集成商以及各类设计人员只需要对硬件接口和一些软件进行更新,UPI就可以轻松升级到CXL。换句话说,因为硬件接口的不同,需要一个新的芯片,CXL是运行在PCIE GEN5电气接口上的协议,UPI是不同的一个接口,因此在芯片与硬件上需要更换。除了硬件之外,从开发者角度来讲,由于API应用接口略有不同,他们在进行迁移时还需要做一些其他的工作。zwPEETC-电子工程专辑

“即便如此,在ISV软件开发者以及CSP云服务提供商看来,UPI仍然带来了极大的好处。现在有了缓存一致性的解决方案之后,开发者可以充分利用一致性来进行应用开发的架构。所以尽管软硬件都需要做一些调整,但并不复杂。”Patrick说。zwPEETC-电子工程专辑

根据规划,为了确保高性能在线处理和处理器负载加速,英特尔下一代10nm Agilex FPGA将支持包括PCIe Gen 5和CXL在内的最新一代高性能处理器接口,并将成为首款采用Xeon可扩展处理器的一致的高速缓存和内存互联结构的FPGA。zwPEETC-电子工程专辑

高宽带一致性能为异构加速带来什么?zwPEETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
邵乐峰
ASPENCORE 中国区首席分析师。
  • 13年,那些我们看着长大的iPhone 富人一般睡醒直接买,小编和穷人才熬夜看发布会,作为从iPhone 4开始就通宵写报道的《电子工程专辑》小编,可以说是看着iPhone慢慢长大的。事实上,iPhone确实在长大,从最初代的3.5英寸到iPhone 12 Pro Max的6.7英寸 ,苹果在13年里发布了29款iPhone。本文将带大家一起回顾iPhone历史上那些重要时刻和事件……
  • 拆解华为5G基站:美国产零部件占成本近3成 近日《日本经济新闻》(Nikkei)在专业调查公司Fomalhaut Techno Solutions的协助下,拆解并分析了华为的最新5G基站,确定了组件制造商并估算了其市场价格。并计算了组成要素的每个国家/地区的组成部分的总价值,以及这些国家/地区的份额。
  • AI芯片:技术发展方向及应用场景落地 经过几年的喧闹后,AI应用场景的落地成为最大难题。AI芯片的设计不是简单的高性能微处理器硬件设计,而是涉及应用场景特定需求和算法的软硬件一体化设计。那么,AI芯片的技术发展未来在哪里?如何真正实现AI场景落地实施和商用呢?
  • WSJ:AMD就收购赛灵思进行深入谈判 10 月 9 日消息,华尔街日报(WSJ)援引知情人士消息称,AMD 正在就收购竞争对手、可编程逻辑芯片制造商赛灵思(Xilinx)公司展开深入谈判。这笔交易的价值可能超过 300 亿美元……
  • 将FPGA打造成为边缘智能时代的桥梁枢纽 “技术和产品架构带来的低功耗特性是我们的核心竞争力!”莱迪思(Lattice)亚太区总裁Jerry Xu在接受《电子工程专辑》专访时,向我们展示了Lattice如何依托核心竞争力,在通信、数据中心、汽车、AI和工业IoT等领域中走出一条和其它FPGA玩家截然不同的道路。
  • “新基建”需要什么样的创新国产IC? 今年四月,国家首次明确了“新基建”的范围后,新需求为国产芯片打开了更大的市场。今年的第十届松山湖中国IC创新高峰论坛,以“新基建”最需要的创新国产IC为主题,推介了10款国内先进的IC新品,展示了国内集成电路产业发展的蓬勃生机。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了