广告

eFPGA中LUT数量将超越FPGA

时间:2022-06-11 01:14:53 作者:Geoff Tate 阅读:
凭借并行可编程及灵活性,FPGA一直活跃在各类系统中,甚至在数据中心和通信等应用中具有战略地位。然好事并不总成双,其尺寸和功耗都比较大。在此背景下,eFPGA应运而生。通过将FPGA嵌入到主芯片中,保有了既有优点,又克服了缺点。故作者观点认为,eFPGA将会加速发展,并在本年代的晚些时候超越FPGA 。
广告

FPGA已经成长为一项战略性技术。它曾被视为“穷人的ASIC”,且能够为小批量应用提供定制化IC。如今,当其仍然以这种方式广泛用在许多系统中的同时,在两个巨大且高成长的市场应用中已具有战略重要性:

·云端数据中心:网络连接﹑储存和安全性。

·通讯系统:基站和5G等。

事实上,由于FPGA对数据中心所具备的战略性意义,使得Intel最近收购了Altera,AMD最近也买下了Xilinx。这是因为在许多情况下,处理器的工作负荷正被移转到FPGA上。

大量利用FPGA的数据中心,能够提供处理器所无法实现的并行可编程能力(有客户称其为"硬件速度的可编程")。这些FPGA与具有特定功能的IC搭配,例如网络接口控制器 (NIC)和网络交换机芯片。每个数据中心有不同的工作负荷,藉由一个标准化的产品来满足所有需求是行不通的,因为每个数据中心都有不同的、使其需求最佳化的容量和建设成本。

通讯系统长期以来都利用FPGA来处理数以百计的法定频段和协议。如今在5G环境中,FPGA被用来管理复杂性和诸如O-RAN等持续变化中的标准。

尽管如前所述,FPGA的可编程很有价值,但其功耗和尺寸却不尽人意。结果,如今的数据中心和通信公司都欲将他们的FPGA整合到其SoC中,以减少尺寸和功耗。

FPGA行业整合已经开始

近十年来,例如Achronix、Flex Logix和Menta等公司,已经具备提供嵌入式FPGA(eFPGA)产品的能力。eFPGA现在可以在180nm到70nm的工艺节点上制造,产能从1K LUT到100K LUT,上限即将迈向1M LUT。也可以选用DSP和内存块-RAM。下列是一些有关采用eFPGA的历史,它们现在已经遍布整个行业。

第一个宣布成功使用eFPGA的客户是Sandia National Labs,在新墨西哥州的180 nm工艺上实现了这个目标。从此之后,他们利用eFPGA制造了许多ASIC芯片。

接下来,波音、美国空军研究实验室 (AFRL)、微软、BAE和许多其他政府机构与外包业者,也开始在美国制造的防卫系统中密集使用eFPGA。因此,对国防部和能源部而言,eFPGA现在已经是一个成熟的技术。

宸芯科技有限公司(大唐电信的一个子公司),宣称将把eFPGA用于FinFet ASIC,以供车对车(car-to-car)通信之用。

Dialog发布了eFPGA的ForgeFPGA产品系列,从1K LUT、批量成本低于50美分开始,且功耗仅有几毫瓦。

Flex Logix将eFPGA用在16nm AI推理芯片上,性能超过500 MHz,随着时间的推移和软件的增强,性能可以提升到667MHz和800MHz。

Socionext正在和一个重要系统厂商开发7nm SoC芯片,通过利用eFPGA和100K LUT的可编程逻辑电路,使得芯片在最坏的情况下,还能够有超过500 MHz的表现。这是一款5G应用与首款嵌入大量LUT的大容量通信芯片。

除了上述之外,有很多客户正在利用尚未公开的eFPGA。随着人们对技术认知的增加、以及领导厂商正利用eFPGA在其市场上取得显著的优势,客户采用eFPGA的步伐正在加速中,

集成FPGA能夠实现更多的软件控制

FPGA有一些显著的优势,但是编程设计不太容易,而且与处理器编程员相比,合格的FPGA程序员的人数并不多。

为什么FPGA不容易进行程序设计呢?

比起C++,Verilog更像是汇编语言的一种低级程序语言。

对传统的程序员而言,平行程序设计是很难以理解和学习的。

FPGA被编程设计成一个巨大的代码”块”。而处理器编程中包含有被程序员视为理所当然的子程序、主程序、链接器和加载程序、分页等等,但这些在FPGA编程中都无法使用。

单元FPGA编程可以在几秒内完成,并会永久驻留在硬件中,但对于整个FPGA来说,通常都必须进行重新编程。有一些部分单元程序速度很慢,在运行时,其他所有操作都会暂停。而在处理器代码中,当主程序运行时,分页程序却能不间断地在缓存中进行数据交换。

eFPGA则为人们提供了一个重新思考编程策略的机会,节约稀缺的Verilog编译器资源,并使C++编译器能够对FPGA进行软件控制。

以下是执行此方法的基本概念:

1.将代码封装/模块化成子程序。

将FPGA分割成更小的模块或容器(container),并为每个模块或容器提供对DRAM内存和处理器的直接访问。

eFPGA已经可以利用小方块式的模块化建构方法,如果需要,这些方块可以利用每排之间的RAM块(BRAM)相扣在一起。

这么一来很容易增加一个系统的相互连接/NOC/AXI总线,并让每个FPGA模块/容器能够访问內存/处理器。

于是写入FPGA的代码就能够像一个容器里面所包含的子程序一样地运作;可以给它提供输入数据或是指向系统內存数据的一些指针;在FPGA执行之后;可以将结果提供作为输出数据或是指向系统內存数据的指针。

利用稀少的Verilog编译器来写入那些需要密集运算的”子程序“,然后让C++编译器在处理器上写入代码,在需要的时候调用那些子程序。

2.允许容器/模块大小可变

把一个FPGA分割成更小的模块或容器,能够允许它们直接访问DRAM存储器和处理器。

有些算法比较简化,使用的LUT较少,而有些用的LUT较多。

举例来说,使用Flex Logix的Flex interconnect fabric,可以使容器具有任意大小的矩形尺寸,甚至可以扩大到整个阵列。

3.支持容器微秒分页

FPGA总是可以在几秒钟内从闪存中编程——速度确实非常慢,但编程通常很少这么做:在启动时或需要升级时才会这么做,比如对iPhone进行升级。

然而,eFPGA已经在领先的AI推理处理器中以百万分之一秒的速度重新编程。这的确是需要的,因为推理加速器处理一个神经网络层,需要进行数十亿次计算,然后在接下来的i<10微秒内重新配置并重新启动运算。

这种微秒级的重新配置可应用于上述阵列中的容器/模块。

在重新配置容器时,其余容器继续全速运行。

这使得eFPGA可以像处理器一样进行分页。

控制FPGA

我们已经看到了行业从简单的ALU发展到处理器、再到微处理器、再到并行处理器、然后再到SOC(包括内核和加速器)的转变。如今,我们有了可重新配置的SOC,可以更好地利用系统中的大量内核。

eFPGA将使数据中心和通信用户能够继续受益于FPGA的并行编程能力,同时降低功耗、缩小尺寸,并通过对FPGA进行软件控制,提高生产率和缩短上市时间。出于所有这些原因,eFPGA利用计算架构中的范式转变,既通过集成提高了每机架的计算密度,也允许更庞大的C++程序员队伍能够分享eFPGA的优势。基于这些原因,eFPGA集成将加速,在本年代末,集成到SOC中LUT数量将会超过FPGA。

Geoff TateFlex Logix首席执行官

(参考原文:eFPGA LUTs Will Outship FPGA LUTs Later This Decade

本文为《电子工程专辑》2022年6月刊杂志文章,版权所有,禁止转载。点击申请免费杂志订

责编:Jimmy.zhang
  • Intel 4工艺剖析:可以算是4nm吗? 市场当前格外关注Intel 4工艺的推进情况。此前我们对这代工艺的实现细节是一无所知的,仅知Intel 4是Intel首个采用EUV光刻技术的工艺、相比Intel 7能实现每瓦性能20%提升,以及Gelsinger宣布去年二季度Intel 4进入tape-in阶段。这次公开Intel 4的更多技术细节……
  • M1芯片存在“不可修补”硬件漏洞PACMAN,苹果回应:不足为 研究团队将其攻击方式称之为"PACMAN"(吃豆人),意思是通过"猜测"PAC发挥作用,该代码是一种加密签名,可以确认一个应用程序没有被恶意更改。由于PAC的可能值只有一定数量,研究人员发现有可能将它们全部尝试一遍以找到正确的值,并抑制崩溃,从而启动连锁攻击,最终构建控制流劫持攻击……
  • 构建新一代云计算体系 阿里云CIPU定义下一代的“云 CIPU让整个云数据中心内的服务器形态以“CIPU+飞天”为中心,各项性能远超国际最先进水平。Gartner最新数据显示,2021年阿里云在全球云计算市场中排名第三、亚太市场排名第一;全球市场份额为9.55%。
  • 全球智能手机芯片份额排名:联发科和高通都是第一?华为海 目前全球手机移动处理器排名前五大品牌的市占率,依序为:联发科(38%)、高通(30%)、苹果(15%)、中国紫光展锐UNISOC(11%)与三星(5%)。 华为海思芯片出货量则是持续衰退至仅剩1%,位居第六名。
  • 谷歌挖IBM人才造处理器,元宇宙也10倍薪抢人才? 近日谷歌挖走了在IBM工作了21年、负责IBM Z System芯片的首席架构师安东尼·萨波里托(Anthony Saporito),担任其首席架构师,负责下一代处理器设计。
  • 英特尔冻结PC芯片部门招聘抵御经济不确定性 近日英特尔(Intel)宣布已经冻结了台式机和笔记本电脑芯片部门的招聘工作,并将重新评估工作重点,预计在两周内恢复部分招聘工作。Intel此次冻结招聘工作,是为了调整后续工作的重点和优先级,从而应对之后宏观经济问题上的不确定性……
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。
  • 龙蜥社区:Anolis OS 23正式版将于 近日,龙蜥社区对外公布了下一代龙蜥操作系统(Anolis OS 23)研发路线图,PoC版已在社区官网上线,正式版本将于2023年发布,它支持X86、ARM-v9、RISC-V等多种芯片架构,并集成更多核心自研组件。
  • Matter标准:助力智能家居实现更高水 智能家居行业领先的供应商和潜在供应商已携起手来,为智能家居产品的互通性采取进一步行动,制定新的标准,即基于互联网协议(IP)的Matter标准。
  • 阅码场训练营:ARM架构与调试调优 01讲师介绍十四年IT基础设施研发经验,其中包括六年Linux kernel一线研发经验,在suse,华为,星际比特(技术合伙人)等公司工作。作为团队核心成员参与了大陆第一个Cortex-A8 SOC
  • 半导体设备供应商TOP20:ASML仅排第二 近日,公众号“半导体设备与材料”发布了其统计的2021年自然年的半导体设备供应商TOP 20榜单(备注:未统计中国大陆企业)。如下图所示,在2021自然年,应用材料稳居行业第一,销售额达到242亿美元
  • 618大促2k-5k价位段的OPPO手机怎么选?一问盘点拯救选择困难症 一年一度的618大促即将来临,不少想换机的朋友都已经迫不及待了。而对于那些还在犹豫不决,不知道选哪个品牌手机的朋友,这里笔者就来给大家提供一份入手OPPO手机的购物指南,拯救你的选择困难症!其中就包括
  • 一文读懂自动驾驶系统多传感器信息融合 ↓↓关注回复“资料”,领取特斯拉专利技术解析报告↓↓多传感器信息融合系统功能和结构模型信息融合模型可以用功能、结构和数学模型等几方面来研究和表示。功能模型从融合过程出发,描述信息融合包括哪些主要功能、
  • 直播预告|从系统调试调优角度拆解arm特性 01讲师简介十四年IT基础设施研发经验,其中包括六年Linux kernel一线研发经验,在suse,华为,星际比特(技术合伙人)等公司工作。作为团队核心成员参与了大陆第一个Cortex-A8 SOC
  • ARMCPU创业潮加剧ARM阵营同质化和无序竞争 最近,国内掀起了一波ARM CPU创业潮,一批初创公司试图开发ARM服务器CPU,其中部分头部公司的估值为 2-3 亿美元,这一波ARM CPU创业潮吸引了一批资本前来助威,一些善于讲故事的弄潮者在半
  • C语言的注释要注意几点 关注+星标公众号,不错过精彩内容编排 | strongerHuang微信公众号 | strongerHuang如果领导给你一个项目的源码让你阅读,并理解重构代码,但里面一句注释都没有,我想这肯定是之前
  • 珠海普生医疗招聘FPGA工程师 大侠好,欢迎来到FPGA技术江湖,江湖偌大,相见即是缘分。大侠可以关注FPGA技术江湖,在“闯荡江湖”、"行侠仗义"栏里获取其他感兴趣的资源,或者一起煮酒言欢。“煮酒言欢”进入IC技术圈,这里有近50
  • 【爆料】OPPO首款竖向折叠屏旗舰曝光 关注国产手机最新消息:目前竖向折叠屏手机中的代表机型有华为P50 Pocket、三星Galaxy Z Flip3和摩托罗拉刀锋5G折叠屏手机等,现在OPPO即将加入竖向折叠屏手机阵营。今天,博主@数码
  • 如何看待龙芯发布仿真SPEC35分       设计CPU,当然需要有在流片之前就能评估性能的本领。  龙芯有几项专利就是关于性能(仿真)评估的。  龙芯的性能评估结果这几年越来越准确,但公开宣传的性能却越来越保守。龙芯CPU的官方实测
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了