向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

兼具FPGA灵活性和ASIC性能:新兴AI/ML应用需要新的FPGA架构

时间:2019-05-28 作者:顾正书 阅读:
在FPGA市场,Xilinx和Intel是两家主导厂商,几乎占据HPC和数据中心的全部市场,留给其它FPGA厂商的机会很小。然而,有一家位于硅谷的小公司Achronix却跃跃欲试,想凭借突破性的FPGA技术和独特的产品策略抢夺这一市场的更多份额,他们有赢得市场和客户的机会吗?
电子工程专辑 EE Times China -提供有关电子工程及电子设计的最新资讯和科技趋势
据Semico Research的最新预测,新兴AI应用为FPGA创造的市场增长迅速,未来5年的CAGR将超过38%,到2023年规模达到52亿美元。这一市场增长主要来自云平台数据中心和高性能计算(HPC)应用,但针对这类应用的AI算法很多,而且仍在不断变化中,目前仍没有占据主导地位的AI芯片架构,GPU、CPU和FPGA都有机会。
图1:Semico对AI应用为FPGA创造的市场规模预测
 
在FPGA市场,Xilinx和Intel是两家主导厂商,几乎占据HPC和数据中心的全部市场,留给其它FPGA厂商的机会很小。然而,有一家位于硅谷的小公司Achronix却跃跃欲试,想凭借突破性的FPGA技术和独特的产品策略抢夺这一市场的更多份额,他们有赢得市场和客户的机会吗?
 
Intel虽然在数据中心和HPC市场霸占着压倒性的龙头地位,但在新兴的AI应用上,传统通用CPU正逐渐失去优势,英伟达的GPU一跃成为这一新兴市场的宠儿。微软和亚马逊在FPGA上的投入也为FPGA行业注入了新的活力。尽管Intel有着最为完整的产品线,但收购Altera以来却一直没有明确FPGA的战略地位和价值。收购Mobileye决定了其FPGA在汽车市场已经没有发挥空间,最近发布的Agilex平台似乎希望将FPGA纳入其针对高端市场的整体方案的一部分,但能够发挥多大的价值还有待观察。
 
反观Xilinx在新兴的AI应用上做得有声有色,相对弱小的私营公司Achronix在强敌目前能否站稳脚跟?在最近举行的新闻发布会上,其CEO Robert Blake蛮有信心地表示,客户需要更多选择,Achronix有能力凭借其创新的FPGA+创新技术赢得客户青睐。对于FPGA,新兴AI应用要求芯片不但具有传统FPGA的灵活适应性,而且要有ASIC的性能,要同时在算力、数据传输、存储器层级和接口等方面达到最佳的能效比。如果还是按照传统的FPGA逻辑思路来设计,芯片尺寸、面积和性能将难以满足HPC和数据中心对AI推理的要求。
 
 
 
图2:新的FPGA架构要兼具传统FPGA的灵活适应性和ASIC的性能
 
芯片内部各功能模块之间的数据传输现在成了芯片性能提高的瓶颈。异构计算虽然是处理器发展趋势,但将不同架构的模块塞进一个芯片里并不能解决所有问题,相互间的数据传输和互联接口会导致延迟而影响性能,因此同构计算的架构仍有独特的优势。Achronix最新发布的Speedster7t芯片从三个方面对传统FPGA进行了彻底改造,从而满足高性能计算、高速内部数据传输,以及高速储存访问和接口的要求。

机器学习处理器(MLP):专为AI/ML性能而优化的数学运算模块

带有DSP引擎的传统FPGA是针对无线滤波等复杂应用而设计的,需要高精度和浮点数字格式,但在处理AI/ML应用时效率比较低,需要消耗额外的逻辑和存储器资源,受限于FPGA路由布线,其性能难以达到AI算法的要求。而专为AI/ML性能而优化的数学运算模块MLP则具有高密度倍乘器阵列,同时支持浮点MAC和整数MAC,而且与存储器块紧密耦合。MLP可以支持FP16、FP24、Block Float 17/12,以及16/8/4位整数运算。
图3:机器学习处理器(MLP)带片上存储并支持多种数学运算格式

GDDR6:高速存储带宽和接口

处理器与片外存储器之间的数据存取已经成为高性能计算和机器学习系统的瓶颈,目前的高速储存标准有HBM和GDDR6。HBM成本比较高,Speedster7t选择支持GDDR6,可以降低成本约50%。每个GDDR6控制器可以支持512Gbps带宽,8个GDDR6的总带宽高达4Tbps。