FPGA行业最大的两家厂商Intel和Xilinx都于今年8月份发布了最新的FPGA加速卡。Achronix在品牌知名度方面也许不如他们,但其FPGA芯片在技术性能上却毫不逊色,尤其是其最新的Speedster7t。Achronix与BittWave合作开发出基于Speedster7t的VectorPath加速卡,在性能上能够跟Intel和Xilinx抗衡吗?

自从30年前AlteraXilinx开创可编程逻辑器件这一芯片类型以来,FPGA经历了巨大的变化,虽然凭借其灵活性和高性能而得以在科研、医疗和航空等高端计算领域得到广泛应用,但FPGA技术和市场始终是一个利基市场产品,在市场规模和销量方面难以跟CPUGPU这类通用芯片相提并论。然而,随着云计算和AI的兴起,特别是微软和亚马逊这两家互联网巨头将FPGA引入其云计算平台,FPGA开始受到业界更广泛的关注,已经成为一个炙手可热的高速增长市场。

数据中心对FPGA加速卡的需求强劲

互联网巨头、云计算服务商和大型企业对数据中心的高性能计算需求越来越大,尤其是深度学习等对AI训练和推理的算力需求如饥似渴,传统的CPU已经无法满足要求。GPUFPGA和专用芯片(ASIC)在这方面找到了用武之地,于是产生了基于CPUGPUFPGAASIC的各种加速卡,以行业标准接口插入服务器即可马上为AI和数据密集型应用带来10-100倍的加速处理性能。

FPGA-VS-CPU.jpg

1FPGA在多种数据密集型应用中性能都比传统CPU高出10-100

FPGA-values-data-center.jpg

2FPGA加速卡可为数据中心带来诸多好处

Semico研究公司预测,全球数据中心加速器(包括CPUGPUFPGAASIC)市场规模将从2018年的28.4亿美元增长到2023年的211.9亿美元,年复合增长率(CAGR)高达50%。其中增长最快的当数FPGA加速器,2018年只有10亿美元,到2023年将超过50亿美元,其增长驱动力主要来自企业级数据负载加速应用。

FPGA-Market-Semico.jpg

3:数据中心加速器中FPGA的增长预测

FPGA加速卡对比:AchronixIntelXilinx

FPGA行业最大的两家厂商IntelXilinx都于今年8月份发布了最新的FPGA加速卡。XilinxAlveo U50加速卡采用Xilinx UltraScale +架构,是其首款采用半高、半长尺寸的Alveo产品,与英伟达的T4 GPU卡尺寸相同。U50具有8GB高带宽内存(HBM2)、超过400 GBps的数据传输速度、100 GB/秒的网络连接,并支持PCIe Gen 4CCIX,其功耗为75瓦。

Intel则发布了FPGA PAC D5005,这是其可编程加速卡产品组合的第二个型号,它基于Intel Stratix 10 SX FPGA,与Intel Acceleration Stack(包括加速库和开发工具)配合可以为Xeon服务器提供数据密集型工作负载的加速。与Intel第一个基于Arria 10 GX FPGA的加速卡相比,FPGA PAC D5005具有三倍的可编程逻辑、高达32 GBDDR4内存(增加了4倍)和更快的以太网端口(两个100GE端口与一个40GE端口)。小尺寸和低功耗的Arria 10 GX FPGA PAC加速卡适用于各种服务器,而大尺寸和大功率的PAC D5005则用于提供更高性能的加速。

Achronix在品牌知名度方面也许不如IntelXilinx,但其FPGA芯片在技术性能上却毫不逊色,尤其是其最新的Speedster7t。这一专门针对高带宽工作负载而优化的高性能FPGA芯片具有如下特性:

  • 采用TSMC 7nm工艺制造
  • 16GDDR6通道,可提供高达4Tbps的存储器带宽
  • 4400G以太网接口(4x400G16x100G)
  • 72SerDes端口,支持1-113Gbps数据速率
  • 4PCIe Gen5端口,支持16通道和8通道配置

Speedster7t_chip_rendering_flat-1024x779.png

4Achronix Speedster7t采用一种全新的二维片上网络(2D NoC)布线结构

相对于Xilinx UltraScale +Intel Stratix 10 SX FPGA的特别之处在于,Achronix Speedster7t在设计上采用了一种新的二维片上网络(2D NoC)布线结构,类似于城市高架立交桥的设计架构,可以极大缓解交通堵塞。此外, Speedster7t还使用一种灵活的机器学习处理器(MLP)专门针对人工智能/机器学习(AL/ML)进行了优化,比如支持多种浮点格式和整数格式,在Int8整数格式下可以提供多达41k的乘累加单元(MAC)和高达134TOPS的运算能力。

Steve_Mensor_Sam.jpg

5Achronix市场营销副总裁Steve MensorBittWave公司副总裁Sam Bichara在深圳联合发布VectorPath加速卡

Magazine191218.jpg

最近AchronixMolex集团旗下的FPGA加速卡设计公司BittWave合作,开发出基于Speedster7tVectorPath加速卡。这一高性能FPGA加速卡采用全高和3/4(GPU一样)的外形尺寸,具有双倍宽带,有被动式、主动式和液冷三种散热方式,专门针对云平台服务商和企业级数据中心应用。此外,BittWave还为其提供了完整的FPGA开发工具BittWork II,具有完整的板块管理控制器(BMC),支持LinuxWindows操作系统。其开发工具包包括APIPCIe Drivers、应用案例设计,以及诊断和自测等。

s7t_vg6_mockup_10_17.jpg

6AchronixBittWave合作开发的VectorPath加速卡基于Speedster7t FPGA芯片

VectorPath加速卡可以支持一系列高速数据和存储接口,包括:

  • 200GbE QSFP56
  • 400GbE QSFP-DD
  • 16PCIe Gen3端口,支持Gen4Gen5
  • 4Tbps GDDR6
  • 8GB GDDR6
  • 4GB DDR4
  • 标准以太网接口
  • GPIOOCuLink扩展接口

achvectorpathboard.png.png

7VectorPath加速卡可以支持一系列高速数据和存储接口

除了FPGA原厂IntelXilinx提供FPGA加速卡之外,还有一些第三方开发商也提供针对特定应用的FPGA加速卡,比如被英伟达收购的Mellanox提供FPGA智能网卡Innova-2 Flex,浪潮基于Xilinx FPGAF37X加速卡集成了8GBHBM2片上高速缓存,而华为基于16nm工艺UltraScale+ FPGA开发的FX系列中端加速卡的典型功耗为75瓦,高端卡为200瓦。

30年来专注于FPGA卡开发的BittWare及其同行Nallatech均被电子组件产品供应商Molex收归旗下,并合并成为新的BittWare公司,从而成为服务于计算、网络和存储应用市场的专业FPGA加速卡开发商。除了基于IntelXilinxFPGA芯片开发FPGA加速卡外,BittWare首次与Achronix合作,开发出更高性能的VectorPath加速卡,同时还可以为数据中心客户提供集成多张VectorPath加速卡的TeraBox FPGA服务器。

结语

面对全球数据中心和企业级应用对计算加速的巨大需求,Intel凭借其CPU+FPGA的优势而占据着主导地位,Xilinx则与AMD合作争抢这一利润丰厚且高速增长的市场。而Achronix作为FPGA市场的小而美玩家,也有其独到之处,与Molex/BittWave合作提供FPGA加速卡将会加速其FPGA芯片在这一市场的推进速度,从而在高性能运算、存储和网络加速市场占据一席之地。

本文为《电子工程专辑》12月刊杂志文章,版权所有,禁止转载。点击申请免费杂志订阅 

也可点击立即下载,下载12月刊完整版。

EETC-1912-Download.JPG

 

 

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
今年内,英特尔计划推出15款FPGA新产品,这一数量超出了英特尔历年来发布的FPGA产品总数,截至目前已经达到了11款,覆盖从通信、数据中心到物联网、汽车、工业边缘各类场景应用需求。
对于网上的裁员传闻,AMD 官方10月26日向媒体回应称:“网络传闻失实。基于公司战略的调整,公司近期对组织架构进行了小幅度的优化和重组。”
自 2015 年被收购以来,PSG一直没有充分服务于FPGA真正的高增长、高利润市场,如工业、汽车、国防和航空航天,而是一直专注于数据中心解决方案,这不利于其他业务部门的发展。如果没有英特尔巨大的业务和官僚压力,PSG能更好地服务于更广泛的 FPGA 市场,而不仅仅是英特尔以数据中心为中心的野心。
开箱即用的K24 SOM主要面向电机系统、工厂自动化机器人等领域,能以信用卡一半的大小提供高能效计算。与其它基于处理器的控制套件相比,KD240支持开发人员在设计周期中更为成熟的节点入手,使入门级开发人员能够轻松使用。
随着网络运营商率先提出“全家智享三千兆”目标,各路大军纷沓而至。将光纤延展至用户的各个房间(即FTTR: Fiber To The Room),为全域提供千兆宽带的覆盖,是未来千兆家庭宽带升级的技术方向之一。 本文介绍基于无源光网传输PON技术在全域光网采用专用芯片ASIC的宽带网络方案。
在连线观赏、直播购物、在线拍卖和社交流媒体等下一代交互式应用场景中,每个人都是主播,他们既是数据源也是接收器,要求对数据的处理更加贴近用户和网络边缘,使得支持传统直播与点播广播的基础设施面临极大挑战
根据TrendForce集邦咨询最新OLED技术及市场发展分析报告统计,在近期发表的摺叠新机中,UTG的市场渗透率已逾九成,随着摺叠手机规模持续成长,预估2023年UTG产值将达3.6亿美元;2024年可望挑战6亿美元。
随着终端及IC客户库存陆续消化至较为健康的水位,及下半年iPhone、Android阵营推出新机等有利因素,带动第三季智能手机、笔电相关零部件急单涌现,但高通胀风险仍在,短期市况依旧不明朗,故此波备货仅以急单方式进行。此外,台积电(TSMC)、三星(Samsung)3nm高价制程贡献营收亦对产值带来正面效益,带动2023年第三季前十大晶圆代工业者产值为282.9亿美元,环比增长7.9%。
治精微推出具过压保护OVP、低功耗、高精度运放ZJA3018
无线技术每天都在拯救生命,有些非常方式是人们意想不到的。在美国加利福尼亚州Scotts Valley,一名路过的慢跑者发现一处住宅冒出火焰后,按响了门铃,试图通知屋主。屋主不在家中,但无线门铃连接到了智能家居中枢,提醒屋主慢跑者试图联系。屋主立即向他提供了安全密码,让他跑进房子,从火场中救出了宠物。
注:各大公司财政年度的起始时间不同于自然年,因此会出现财政季度、年度等与自然年不一致的情况。软件微软(Microsoft)公布截至2023年9月30日的2024财年第一财季业绩。第一财季营收为565.
EETOP编译自electronicdesign1.任何计算引擎,无论是CPU、GPU、FPGA还是定制ASIC,都可以加速GenAI不对。CPU 不具备完成任务的性能。GPU 具有标称性能,但效率较
要点2022 年中国的经济增长不如 2021 年强劲,COVID-19 限制令和持续封锁削弱了中国的经济和制造活动。2022 年,LV 变频器市场增长了 3%,其中大部分增长来自于上一年积压订单的交付
有奖问卷调查:各位工程师朋友,作为全球知名的授权半导体和电子元器件代理商,贸泽电子 Mouser多年来一直倾心为中国工程师服务,助力本土创新! 时至年终,为了更好的服务工程师朋友,我们特别推出“贸泽电
广告分割线12月11日,臻鼎科技集团与协成昌集团(Saha Group)达成了战略合作协议。当晚还举办了“2023庆祝战略合作签约暨鹏晟科技动土典礼晚宴”。本次战略合作协议的签订将进一步促进双方的合作
为加强智慧应急能力建设,以新安全格局服务新发展格局,由中国科学院大学、全国安全职业教育教学指导委员会共同主办的“2023智慧应急发展论坛”于2023年12月10日在京召开。本次论坛主题是“加强智慧应急
点击左上角“锂电联盟会长”,即可关注!文 章 信 息干法改性工艺新认识,助力锂离子电池高镍正极材料实现高结构稳定和热稳定性能第一作者:吴锋通讯作者:苏岳锋*,陈来*通讯单位:北京理工大学,北京理工大学
曹原 发自 副驾寺智能车参考 | 公众号 AI4Auto全球第一的 Tier 1,官宣裁员了。博世刚刚证实,准备裁员1500人,以适应汽车行业不断变化的技术和需求。博世发言人表示:我们面临了比年初预期
芝能汽车出品11月,我国动力和储能电池合计产量为87.7GWh,实际拆解估算动力电池约为70.7GWh,同比上升11.5%,环比上升8.4%装车量44.9GWh,同比增长31.0%,环比增长14.5%
本文来源:物联传媒“2023‘物联之星’中国物联网行业年度榜单” 评选活动正在火热进行中!为深度挖掘物联网领域的优秀企业、创新产品和优秀项目,审读年度热门领域和发展方向,推动物联网行业的普及与宣传,促