根据英特尔提供的数据,2020年,每位互联网用户每天要消耗1.5GB的数据流量;自动驾驶汽车每天要产生4TB的数据;联网的飞机每天要产生5TB的数据;智能工厂每天要产生1PB的数据;云视频提供商平均每天提供750PB视频。由此而来的是,“大数据”时代需要更快捷、高效的计算方式和加速方式。

在云上部署FPGA加速

在云服务器和云计算中实现加速是FPGA的使命之一。微软不久前在2017年高效能芯片大会(Hot Chips 2017)上宣布选择英特尔Stratix 10 FPGA作为其新的深度学习加速平台(代号为Project Brainwave)的关键硬件加速器,通过英特尔Stratix 10 FPGA和至强处理器,Project Brainwave平台在单个请求上实现了超过每秒39万亿次浮点运算的性能。

英特尔可编程解决方案事业部FPGA软件解决方案高级总监Bernhard Friebe在谈到此次合作时表示,微软是第一家在其公有云基础设施中部署FPGA的大型云服务提供商。他们清晰的意识到,在云中,系统需要处理直播数据流(包括视频,传感器或搜索查询)并快速将数据传送回用户,因此提供实时人工智能变得越来越重要。而这种基于FPGA的深度学习加速平台可以提供“实时人工智能”技术,使云基础设施能够以超低延迟来尽可能快速地处理和传输数据。

京东与英特尔联合创新实验室基于FPGA的深度学习线上服务,用于处理图像内容感知等应用,则是另一个典型合作案例。资料显示,来自京东AI与大数据部的研发团队通过Arria 10 FPGA,实现了卷积神经网络(CNN)和长短时记忆神经网络(LSTM),不仅适合京东私有云上的图像处理,还可帮助接入京东云服务的用户使用深度学习线上服务。

图像内容感知识别技术在京东有着广泛的应用场景,其中京东的光学字符识别(Optical Character Recognition, OCR)系统基于CNN+LSTM网络实现了端到端的文字识别,这项技术用于京东敏感词审核、商品描述提取以及用户实名认证等诸多环节。京东集团副总裁,AI与大数据部负责人翁志指出,虽然目前京东的商品详情图上敏感词审核已有95%以上的准确率和90%以上的召回率,但在某些场景中,图片内容的复杂性使得在现有GPU上进行的计算处理会存在延时。而经过测试, Arria 10 FPGA上实现的LSTM加速卡相比GPU在性能上提升了近5倍,避免了一些无用计算,降低了图片的识别延时。 20170929-FPGA-1 除了与微软、京东的合作外,Bernhard Friebe还列举了英特尔FPGA其它的应用案例,包括SWARM64通过FPGA加速,实时数据分析速度可提高5倍以上,传统数据仓储提高2倍以上,存储压缩提高3倍以上。此外,ATTALA的存储器则是利用FPGA加速降低了57-72%的数据延迟。 20170929-FPGA-2

下一代10nm FPGA

Bernhard Friebe认为,CPU+FPGA异构计算是异构结构的第三阶段,相对于专业加速器ASSP/ASIC和CPU+GPU异构计算,CPU+FPGA在加速速度和加速方式上取得了突破。FPGA异构结构具有很高的灵活性,可以面向网络、存储和计算领域中定向和变化的工作负载。FPGA灵活、原生并行、高性能、高能效、可重复编程、低延迟的特点在异构结构中得到充分体现。 20170929-FPGA-3

FPGA在异构计算中具体有两种加速形式,即旁路加速和内建加速。旁路加速可以将重度计算功能转移到FPGA上,从而释放处理器去处理其他功能;而如果时延比较重要,则可以进行内建加速,从而通过FPGA的多功能性带来更好的网络存储和计算的加速。另外,英特尔FPGA产品在数据库加速、基因测序、存储及云端已经有具体的应用,并且达到了很好的效果。

而在日前举办的“英特尔精尖制造日”上,英特尔率先展示了采用自有10纳米(10nm)制程工艺制造的FPGA产品(代号为“Falcon Mesa”),它们未来将被用于满足数据中心、5G、网络功能虚拟化(NFV)、汽车、工业和军事/航天的加速和计算需求。

Falcon Mesa FPGA产品家族将支持112Gbps串行收发器链路和包括PCI Express Gen4x16在内的最新外围设备互联,可面向下一代数据中心提供高达每通道16GT/秒的数据传输率。此外,还将支持多项英特尔最新技术,包括Embedded Multi-Die Interconnect Bridge(EMIB)封装技术、高带宽内存(HBM)和英特尔HyperFlex架构。

20170929-FPGA-4 在提供硬件产品的同时,英特尔还通过最新的加速堆栈产品帮助客户降低开发的门槛,更轻松的实现公有云和私有云的无缝软件迁移。FPGA让“云”的应用有了明显的分层:机架级及云编排、用户应用、行业标准软件框架、加速库、开发者工具、包含OPAE在内的加速环境以及硬件设备。开发人员可以利用云编排软件进行应用程序开发,也可以选择服务商提供的模块化功能。 20170929-FPGA-5 本文为《电子工程专辑》原创,版权所有,转载请注明出处并附链接

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。