广告

性能媲美SRAM的新式内存——TCAM

时间:2019-01-02 作者:Nitin Dahad 阅读:
Leti研究人员基于RRAM的TCAM电路,据称其性能媲美基于CMOS的SRAM,且适于多核心的神经形态网络处理器应用…

法国电子暨信息技术实验室(Leti)日前展示,以电阻式随机存取内存(RRAM)为基础的三态内容可寻址内存(TCAM)电路性能媲美基于CMOS的动态随机存取内存(SRAM)电路,尽管仍存在性能和可靠性之间的权衡折衷,但适于多核心的神经形态网络处理器应用。jWeEETC-电子工程专辑

TCAM电路的工作原理是使用指示范围(range)的屏蔽位来搜寻大量数据组合。相较于典型内存系统透过物理寻址方式检索内存单元储存的信息,TCAM则是透过内容搜寻储存的信息。因此,这些电路的性能非常适于复杂的路由和大数据(big data)应用——这类应用通常不太需要精确匹配。相较于典型的内存搜寻算法,TCAM电路的方式由于平行比对了所有储存数据以及单次频率周期内的搜寻数据,从而缩短了搜寻的时间。jWeEETC-电子工程专辑

传统基于SRAM的TCAM电路通常以16个CMOS晶体管建置,这使得TCAM在标准内存结构下的储存容量经常受限于几十个兆字节(megabyte;MB),而且在神经形态运算神经网络芯片中占用宝贵的芯片面积。jWeEETC-电子工程专辑

Leti在最近的国际电子组件会议(IEDM)上发表研究人员在TCAM技术的最新突破——在TCAM电路中以RRAM取代SRAM内存单元,可将所需的晶体管数量减少到2个(2T)以及在晶体管之上制造两个RRAM (2R),据称这是迄今为止生产这种电路的最紧凑结构。相较于传统的16晶体管TCAM结构,2T2R结构能让所需的TCAM面积减少8倍(假设两种类型的电路中晶体管尺寸相同)。jWeEETC-电子工程专辑

虽然这带来了芯片尺寸和功耗方面的优势,但Leti表示仍存在两项挑战。其一是电路可靠性强烈依赖于内存单元的ON和OFF状态之比:相较于16T结构(~105),基于RRAM的TCAM可靠性可能会受到相对较低ON/OFF比重(~10-100)的影响。其次,RRAM对于CMOS晶体管的耐受度(endurance)有限,而这也会影响到系统的寿命。jWeEETC-电子工程专辑

克服这些挑战需要某些折衷:jWeEETC-电子工程专辑

• 在搜寻作业期间降低施加电压,可以提高系统可靠性;然而,这也会降低系统性能,例如搜寻速度变慢。jWeEETC-电子工程专辑
• 在每次搜寻期间降低施加电压或提高用于预先编程TCAM单元的功率,能够克服有限的耐受度;这两种方式都能高系统的耐受度,但也同时减慢了搜寻的速度。jWeEETC-电子工程专辑

在IEDM发表的《深入表征基于电阻式内存的三态内容寻址内存》(In-depth Characterization of Resistive Memory-based Ternary Content Addressable Memories)一文中,Leti介绍RRAM电气特性和TCAM性能之间的关系,以及制造基于RRAM的电路特性。它显示在TCAM性能(搜寻速度)和TCAM可靠性(匹配/不匹配检测和搜寻/读取耐受度)之间存在折衷。这有助于了解如何对基于RRAM的TCAM电路进行编程,以用于网络封包路由等其他应用。jWeEETC-电子工程专辑

该论文的主要作者Denys RB Ly说:“假设未来的许多神经形态运算架构都具有数千颗核心,研究人员开发的TCAM电路由于具有非挥发特性,将带来更多关键优势,(因为)使用者仅必须在第一次配置网络时上传所有配置位。”他说,这意味着用户可以在每次芯片重设或电源重启时,跳过这个耗时的过程。jWeEETC-电子工程专辑

Ly在接受《EE Times》采访时表示,该计划所采用的神经形态处理器来自苏黎世神经讯息学研究所(INI)的NeuRAM3计划,该计划同时也支持部份基于RRAM的TCAM研究。“如果我们比较神经形态处理器的内容可寻址内存(CAM)电路所需性能,以及基于RRAM的TCAM性能,将会发现尽管存在上述问题,但结果实它确实能满足这些要求。”jWeEETC-电子工程专辑

181213_ND_LETI_800-min.pngjWeEETC-电子工程专辑

神经形态处理器的CAM电路性能和Leti TCAM电路性能比较jWeEETC-电子工程专辑

研究人员并在论文中比较神经形态处理器的CAM电路以及Leti的TCAM电路性能。从搜寻延迟来看,当然是越低越好。然而,由于芯片能够承受非常长的延迟(脉冲相当长,大约为微秒等级),即使搜寻延迟约为90ns,Leti基于RRAM的TCAM也可能用于处理器。当前的CAM电路能够实现低至27ns的搜寻延迟,但是对于像网络路由(延迟~1ns)等典型应用中的CAM电路,这一延迟数字仍然相对较高。jWeEETC-电子工程专辑

支持Leti方法可行的另一个要点在于现有芯片的CAM电路长约10位,而Leti的TCAM电路则长128位。“如果我们将TCAM电路缩小到10位,我们的搜寻延迟还会更低,甚至可能至少低至27ns。而在搜寻耐受度方面,基于RRAM的TCAM电路能够处理所有事件。”再以编程耐受度来看,RRAM极其适用于神经形态处理器的CAM电路,因为它们只需要一次编程。jWeEETC-电子工程专辑

“总而言之,对于神经形态处理器应用,采用基于SRAM的CAM电路可能带来更好的性能、可靠性和耐受度,但我们可以采取折衷途径——即以RRAM取代SRAM单元,则可提高内存密度并降低功耗,同时使该系统仍能满足神经形态处理器的要求。”jWeEETC-电子工程专辑

编译:Susan Hong,EETTaiwanjWeEETC-电子工程专辑

 jWeEETC-电子工程专辑

 jWeEETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
广告
相关新闻
广告
广告
广告
广告