向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

身材虽小,却为数据中心加速提供大智慧

时间:2019-08-13 作者:邵乐峰 阅读:
在当前的超大规模数据中心中广泛部署FPGA产品并不是什么新鲜事。得益于自身所特有的可重配置和可重编程特性,FPGA能为复杂多变的超大规模数据中心应用提供所需的灵活性、应用广度和功能速度,而这些正是传统CPU和定制ASIC所无法企及的,也是阿里巴巴、亚马逊、百度、Facebook、谷歌、微软和腾讯这些超大型数据中心公司最为敏感的问题。

继2018年底推出面向数据中心加速的自适应计算加速卡Alveo U250/U280后,赛灵思(Xilinx)持续扩展产品组合的步伐一直没有停歇,最新推出的Alveo U50系列,则被赛灵思数据中心业务部产品规划和市场营销总监Jamon Bowen称之为“业界首款可支持第四代PCIe(PCIe Gen 4)的轻量级自适应计算加速卡。” ZZrEETC-电子工程专辑

1.jpgZZrEETC-电子工程专辑

赛灵思Alveo产品阵容ZZrEETC-电子工程专辑

快速、灵活应变和方便易用是U50的核心特征。与U200/U250/U280系列相同,Alveo U50卡同样采用赛灵思UltraScale+架构,支持第四代PCIe和CCIX互联标准,并率先使用半高半长的外形尺寸和低于75瓦的低包络功耗。8GB高带宽存储器(HBM2)和QSFP端口则分别提供了超过400Gbps的数据传输速率和高达每秒100Gbps的网络连接速率。此外,高速网络I/O还支持包括NVMe-oF解决方案(NVM Express over Fabrics)、解耦计算存储(Computionial Storage)和专业金融服务在内的各种前沿应用。ZZrEETC-电子工程专辑

2.pngZZrEETC-电子工程专辑

Alveo U50系列加速卡ZZrEETC-电子工程专辑

为什么加速在计算、网络和存储领域受到越来越多的重视?Jamon Bowen对此解释称,一方面是因为以AlexNet、GoogleNet、DenseNet为代表的领域专用架构,需要不同的硬件架构和对应的算法来实现高吞吐量、低时延和高效率;另一方面,数据中心要优化性能,需要定制数据路径、定制精度和定制存储器层级,可编程硬件在定制化加速方面具备天然优势。ZZrEETC-电子工程专辑

以GZIP压缩为例,ZS、ZT、LZ、微软Zipline等标准层出不穷,这就需要硬件不但能够加速,还可以实现编程,一旦出现新的算法迭代,厂商就能够充分利用 FPGA的灵活性实现快速部署。ZZrEETC-电子工程专辑

不过,数据中心开发者对FPGA编程始终带有抱怨。为此,Alveo提供了开放的平台和开发环境,让开发者能够更加便捷地使用。这意味着,Alveo平台上的开发者越多,带来的云和相关产品就会越多,从而逐步形成一个全堆栈的解决方案,继而实现原来只有在软件部分才有可能实现的硬件IP的灵活应变能力。数据显示,自2018年10月推出Alveo以来,目前已发布的应用和培训开发者数量分别是当初的2倍和4倍。ZZrEETC-电子工程专辑

3.jpgZZrEETC-电子工程专辑

Alveo解决方案堆栈ZZrEETC-电子工程专辑

具体来说,Alveo U50的加速解决方案具体可应用于广泛领域,其中包括以下5个领域:ZZrEETC-电子工程专辑

1、深度学习推理加速(如语音翻译):与纯GPU相比,Alveo U50在语音翻译的性能可降低多达25倍的延迟,提高10倍的吞吐量,并能显著提高每节点的功耗效率。ZZrEETC-电子工程专辑

2、数据分析加速(如数据库查询):运行TPC-H查询基准时,Alveo U50与存储器内的CPU相比,它每小时的吞吐量可提升4倍,还可将运营成本降低3倍。ZZrEETC-电子工程专辑

3、计算存储加速(如压缩):与仅使用CPU的节点相比,Alveo U50将每个节点的成本降低了40%,同时它还可将压缩/解压的吞吐量提高20倍,实现更快的Hadoop(分布式计算)和大数据分析。ZZrEETC-电子工程专辑

4、网络加速(如电子交易):与仅使用CPU的10微秒延迟相比,Alveo U50能将延时降低20%,交易时间低于500纳秒。ZZrEETC-电子工程专辑

5、财务建模(网格计算):运行蒙特卡罗模拟(Monte Carlo simulation)时,Alveo U50的功耗效率与GPU相比提高7倍,具有更快的分析和判断效率、确定性延时和更低的运营成本。ZZrEETC-电子工程专辑

“提供充分商业化的标准化产品,是调动IT行业积极性最重要的因素之一。”Jamon Bowen说Alveo是一个非常标准化的产品,所以开源框架很容易与Kubernetes和docker这类免费的微服务内容平台实现对接,比如Kubernetes中就直接有插件可以在系统内部反映出有Alveo加速硬件,开发者也可以把Alveo和docker配合起来,通过对Alveo进行编程而在系统中体现出加速应用。ZZrEETC-电子工程专辑

4.jpgZZrEETC-电子工程专辑

为大规模部署而打造的堆栈ZZrEETC-电子工程专辑

反之,如果没有这样一个标准化的产品配置,客户可能需要花费大量的投资才能够实现这样一个功能,这对于一些超大规模数据中心的应用来说是非常有必要的,既可以在云端,也可以用Alveo在本地进行加速,而且是一个非常开放式的框架,可以进行全面的加速。ZZrEETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
邵乐峰
ASPENCORE 中国区首席分析师。
您可能感兴趣的文章
  • 蔡司CEO:6400万像素幼稚!小米三星:1亿像素相机手机来了 8月7日,小米集团总裁林斌宣布小米集团旗下Redmi品牌,将联合三星全球首发首款量产6400万超清相机手机,以及小米全球首款1亿像素超清相机。而就在几天前,蔡司集团总裁兼CEO Michael Kaschke博士表示不赞成手机厂商堆像素的做法,他认为三星宣布的6400万相机传感器有些过火……
  • 日本反垄断调查苹果:涉嫌压榨供应商并窃取技术 日本反垄断机构(FTC)正对美国苹果公司发起调查,苹果涉嫌滥用权力施压日本零部件制造商进行技术转移。其实对于苹果来说,压榨供应商并“顺走”一些技术点子,然后踢掉供应商自己来,或是在合同中给出一些霸王条款,其实早已不是新鲜事……
  • 阿里平头哥发布“最强”RISC-V处理器玄铁910 阿里巴巴旗下半导体公司平头哥正式发布玄铁910(XuanTie910),号称目前业界性能最强的RISC-V处理器。据介绍,玄铁910可以用于设计制造高性能端上芯片,应用于5G、人工智能以及自动驾驶等领域,未来将开放其IP Core的FPGA代码下载……
  • 13年了,Zen 2架构终于让AMD达到Intel的高度? Intel这两年的日子真是相当不好过,也不只是和苹果在基带的事情上闹掰,和宣布放弃5G基带产品;而且在AMD于2017年推出Zen架构,终于彻底抛弃CMT以后,Intel居然在桌面处理器产品线上一时乱了阵脚。Jim Keller带领下Zen的猛然一击,竟然让近两年桌面处理器的性能获得了前些年从未有过的步进,Intel都让低压U用上四核了,这在摩尔定律逐渐停滞的当下还真是奇景。
  • 中科院大学“龙芯录取通知书”嵌入的国产CPU啥来头? 中国科学院大学在给本科生录取通知书中,嵌入了一枚“龙芯三号”实物芯片,这让很多立志于国产自主芯片研发生产有志青年感觉很“燃”,也让一些分不清龙芯和汉芯的人开始无脑喷。中科院官微强调了两者的区别,并表示龙芯目前已实现通过市场来养活自己,支撑研发。那你是否知道,龙芯是一家什么性质的公司?他们做什么芯片?从1号到3号这三代龙芯有哪些进步?
  • AIoT不比手机,联发科:除了技术,还拼兄弟 联发科明显不仅仅满足于将“AI”用在手机市场,在7月10日举办的AI合作伙伴大会上,联发科携手包括小米、阿里巴巴、TCL、长虹、创维、旷视科技、海信、海尔、优必选等在内的多家人工智能及智能家居合作伙伴,把你能想到的地方,都加上了AI……
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告