广告

利用片上高速网络(2D NoC)创新地实现FPGA内部超高带宽逻辑互连

时间:2020-02-29 作者:黄仑 阅读:
这是一个运用NoC来优化加解密设计的例子。本文主要想通过这样一个例子给广大FPGA设计者展示如何利用NoC来进行FPGA内部逻辑的互连,从而给广大FPGA设计者提供另一种考虑问题的思路。在传统的FPGA设计中出现了性能无法提升,布局布线拥塞的时候,是否可以考虑利用Achronix新一代的Speedster7t FPGA来简化和加速用户的设计。
广告

Achronix 最新基于台积电(TSMC)的7nm FinFET工艺的Speedster7t FPGA器件包含了革命性的新型二维片上网络(2D NoC)。2D NoC如同在FPGA可编程逻辑结构上运行的高速公路网络一样,为FPGA外部高速接口和内部可编程逻辑的数据传输提供了超高带宽(~27Tbps)。

图1  Speedster 7t FPGA结构图

NoC使用一系列高速的行和列网络通路在整个FPGA内部分发数据,从而在整个FPGA结构中以水平和垂直方式分发数据流量。NoC中的每一行或每一列都有两个256位的、单向的、行业标准的AXI通道,可以在每个方向上以512Gbps(256bit x 2GHz)的传输速率运行。

NoC为FPGA设计提供了几项重要优势,包括:

1.提高设计的性能。

2.减少逻辑资源闲置,在高资源占用设计中降低布局布线拥塞的风险。

3.减小功耗。

4.简化逻辑设计,由NoC去替代传统的逻辑去做高速接口和总线管理。

5.实现真正的模块化设计。

本文用一个具体的FPGA设计例子来展现NoC在FPGA内部逻辑互连中发挥的重要作用。本设计主要是实现三重数据加密解密算法(3DES)。该算法是DES加密算法的一种模式,它是对于每个数据块应用三次DES加密算法,通过增加DES的密钥长度增加安全性。

在该FPGA设计中,我们将输入输出管脚放在的FPGA上下左右四个方向上。上面管脚进来的数据经过逻辑1进行解密然后通过蓝色的走线送到逻辑2加密以后从下面的管脚送出。左边管脚进来的数据经过逻辑3进行解密然后通过红色的走线送到逻辑4加密以后从右边的管脚送出。如图2 所示。

图2  3DES设计(没有用NoC)后端布局布线图

本设计遇到的问题如下:

加密和解密模块中间的连线延时太长,如果不增加流水寄存器(pipeline),设计性能会收到很大限制。但是由于连接总线位宽是256位,增加几级流水寄存器又会占用很多额外的寄存器资源。

上下模块之间的连接总线和左右模块之间的连接总线出现了交叉,如果设计再复杂一点有可能会遇到布局布线局部拥塞,会大大增加工具布局布线时间。

上面两个问题也是广大FPGA设计者在复杂FPGA设计中或多或少会遇到的问题,导致的原因有可能是设计比较复杂,也有可能是硬件平台的限制,或者设计必须连接不同位置的外围Hard IP导致。

NoC的出现让我们上面遇到的问题迎刃而解。NoC为FPGA逻辑内部互连提供了双向288bit的原始数据模式(Raw data mode)。 用户可以通过这288bit的信号进行逻辑直连或者自定义协议互连。

图3  利用2D NoC进行内部逻辑互连

在NoC的每个交叉点上都有两个网络接入点(NAP),用户只要简单地通过例化NAP的原语或者宏定义就可以将自己的逻辑接入到NoC并进行互连。

图4  网络接入点NAP

        

图5  例化NAP宏定义示例

这样通过在3DES加密和解密模块上分别例化NAP,就可以实现3DES加密和解密模块之间的NoC互连。

图6  3DES设计(利用NoC)后端布局布线图

这样在简化用户设计的同时,设计性能有了很大的提高,从之前的260MHz提高到了750MHz。 图6中可以看到之前逻辑之间大量的连接总线已经看不到,总线的连接都由NoC接管,在后端布局布线图中只能看到绿色时钟走线和白色模块内部的逻辑走线。

作者:Achronix资深现场应用工程师  黄仑

责编:Amy Guan

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 硬件循环(HITL)或数字孪生(DT):设计建模到底用哪个? 硬件循环(HITL)或数字孪生(DT)哪个更好?这取决于实际应用。决定性因素包括创建各自模型的时间、对模型的信任度以及模拟I/O的复杂性。你对数字孪生、硬件循环以及其他复杂的模型和工具有何看法或经验?
  • 下一代服务器内存展望:新一代DDR5 DIMM的五大亮点 2020年7月14日,JEDEC发布了DDR5 SDRAM标准,标志着整个行业即将向DDR5服务器双列直插式内存模块(DIMM)过渡。DDR5内存带来了一系列重要改进,有望帮助下一代服务器实现更好的性能和更低的功耗。以下是DDR5内存的五大亮点。
  • 怎样为电源开关设计选择最佳MOSFET? MOSFET(金属氧化物半导体场效应晶体管)主要用于开关应用中,具有高电压和高电流的特点。使用MOSFET是一个非常有趣的经历,它可以极大地提高电路效率并扩充其操作可能性。我们来看一些筛选标准,以便为电力电子解决方案选择合适的MOSFET。
  • 碳化硅技术如何变革汽车车载充电? 对于全球OBC模块正在设计中的汽车,提高系统能效或定义一种高度可靠的新拓扑结构已成为迫在眉睫的挑战。为了提高OBC系统的能效,人们研究了不同的PFC拓扑结构。
  • 如何使用高层次综合(HLS)方法加快自动驾驶设计流程? 自动驾驶汽车和 ADAS 的实现取决于能否融合来自 LiDAR、雷达、摄像机和其他装置的传感器数据。传感器融合任务将越来越多地使用定制处理硬件FPGA 或 ASIC 来完成。而且需要更多的定制芯片来应用机器学习和 AI,以基于这些传感器数据做出决策。本白皮书介绍了如何使用高层次综合 (HLS) 方法加快设计流程和应对验证挑战,在某些情况下,该方法远优于手工编码的RTL。
  • 为何直流电能计量很重要,怎样设计直流电表会更好? 精确的直流电能计量变得越来越重要,特别是涉及到电能计费的地方。本文将讨论直流计量在电动汽车充电站、可再生能源发电、服务器场、微电网和点对点能源共享方面的发展机会,并介绍一种直流电表设计。
  • 千亿级别的暴涨与暴跌的比特币为啥 比特币暴跌20%或有400亿美金资金爆仓,显卡行业也深受波及,而这背后一方面是政府的禁令频发,另一方面金融犯罪的案例被推到了台面上,再加持众多资本狂割韭菜使得整个市场乌烟瘴气。而纵观发展历史,速度快的CPU为何没有用武之地呢,本文来带你一探究竟。
  • EE快讯——华为2021第18届全球分析 2021年4月12日,华为在深圳举办了第18届华为全球分析师大会,会上华为徐文伟提出了未来10年九大技术挑战与研究方向;轮值董事长徐直军表示:6G比5G快50倍,将在2030年左右推出,同时表示要提升软件能力减少芯片依赖,对海思的态度是养得起,也会一直养着,对于业界一直猜测的麒麟9000芯片库存还有多少,徐直军表示:华为的库存可以支撑公司活得更长一点。另一方面,欧菲光的前途终于有了结果...
  • 紫光展锐:大破大立,做数字世界的生态 4月20日,以“构go”为主题的2021紫光展锐创见未来大会在线上举行。会上,展锐重磅发布了5G业务新品牌——唐古拉系列,推出了Cat.1bis新技术特性,并分享了创新业务AR领域的最新商用进展。此外,展锐重申了公司产业定位——数字世界的生态承载者,并公布了对消费电子业务和工业物联网领域的前瞻预见和战略规划。
  • 安谋中国发布全新“山海”S12解决 安谋中国今天发布面向 AIoT 系统的全栈安全解决方案“山海”S12,包含硬件加解密引擎、安全软件和安全服务三大部分,从芯片的安全 IP 层到云端安全应用和安全管理提供全链路的安全保护。“山海”S12可以广泛应用于智能手机、平板、智能电视及安防等行业,为多种安全解决方案如数字版权保护、AI 安全、身份认证等提供基础安全能力。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了