向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

SRAM,你究竟肿么了?

时间:2019-01-03 作者:Andrew Walke 阅读:
SRAM在经过多年作为计算机内存的主力后,如今也在成本和能效方面遭遇严峻挑战...

利用磁性材料作为计算机用内存,可以追溯到1940年代末发明磁芯(Core)内存之时。从1960年代起,硅基内存的出现,阻碍了磁性内存的进一步发展,同时也带动静态随机存取内存(SRAM)、动态随机存取内存(DRAM)以及各种形式的非挥发性内存被广泛采用。各种内存类型迅速扩展,伴随着计算机中央处理单元(CPU)对于加快速度的要求,导致了所谓的“内存阶层”(memory hierarchy),如图1所示。ag5EETC-电子工程专辑
181217_SRAM_pyramid_2_800-min.pngag5EETC-电子工程专辑
图1:内存阶层显示传统内存类型如何以速度(越接近顶部速度越快)和容量(接近底层容量最大)排列ag5EETC-电子工程专辑

速度更快且更昂贵的SRAM内存在实体上更靠近CPU,二者通常位于同一个芯片上。另一方面,相对速度较慢的DRAM内存在实体上远离采用客制芯片工艺制造的单独芯片,从而为最大内存密度实现优化。尽管金字塔形的阶层式内存可能给人固定不变的印象,但是,存在数十年的内存类型在使用上仍然出现了重大问题。ag5EETC-电子工程专辑

如今,距离SRAM的发明已经将近50年了,内存产业正处于颠覆的阵痛期。 NAND Flash已经朝向3D转型,而DRAM也正接近其微缩极限。SRAM在经过多年作为片上存储器(on-chip memory)的骨干后,如今也在成本和能量耗费方面遭遇严峻的挑战。这些半导体内存方面的问题,加上所涉及的市场规模,导致市场上陆续出现各种候选技术以取代内存——特别是针对SRAM。ag5EETC-电子工程专辑

SRAM面临的挑战

SRAM是采用任何CMOS工艺“免费提供”的内存。自CMOS发展早期以来,SRAM一直是开发和转移到任何新式CMOS工艺制造的技术驱动力。随着近来用于深度学习的所谓“特定领域架构”(DSA)崛起,每个芯片上的SRAM数量达到了数百个兆位(megabite)。这带来了两项具体的挑战。ag5EETC-电子工程专辑

第一项挑战是随着采用FinFET晶体管的最新CMOS技术进展,内存单元尺寸的效率越来越低。从图2就可以看到,SRAM单元尺寸可以绘制为CMOS技术节点的一个函数。ag5EETC-电子工程专辑
181217_SPIN3_800-min.jpgag5EETC-电子工程专辑
图2:6T结构的SRAM单元尺寸在过去30年来的缩小演变。值得注意的是,当 FinFET晶体管成为CMOS的基础后,速度开始趋缓(来源:1987~2017年国际电子组件会议(IEDM))ag5EETC-电子工程专辑

从平面到FinFET (planar-to-FinFET)的转变对于SRAM内存单元的布局效率有着显著的影响。采用FinFET的临界间距逐渐缩小,导致SRAM单元尺寸缩减迅速减缓。有鉴于对于更大片上SRAM容量的需求不断增加,现在正是最糟糕的情况了。我们距离SRAM将主宰整个DSA处理器大小的情况不远了。ag5EETC-电子工程专辑

第二项挑战在于从正电源流经SRAM单元到接地的漏电流。其中很大一部份原因是次阈值晶体管泄漏的指数级温度启动——这意味着随芯片变热,这种漏电流将会急剧增加,这导致了能量的浪费。虽然这通常称为静态功耗,但这种漏电流也会在SRAM处于有效使用状态时发生,并形成能量浪费的下限。ag5EETC-电子工程专辑

近20年来一直是使用缓解技术来限制这种影响,最先进的方式是将SRAM电源电压从其工作值降低到所谓的数据保持电压(DRV)。一开始,这种技术带来明显减少的漏电流,降低至工作电源电压值的5到10倍。随着技术节点日趋进展,电源电压不断降低,工作电压和DRV之间的裕量也缩小了,导致使用这种技术的漏电流减少,大约仅减少2倍。ag5EETC-电子工程专辑

基本上,我们已经用尽了各种得以缓解漏电流的技术了,但“日益坐大”的SRAM容量仍将带来大量的电流浪费。图3显示CPU芯片上的SRAM容量每18个月增加一倍。ag5EETC-电子工程专辑
181217_SPIN2_800.pngag5EETC-电子工程专辑
图3:随着片上SRAM容量不断增加,在50℃时预期会出现的SRAM漏电流。图中结果模拟自次10奈米CMOS中的晶体管漏电流资料ag5EETC-电子工程专辑

这两种SRAM的挑战,再上对于增加片上高速缓存速度和容量永无止境的需求,导致在成本和浪费能源的使用方面造成真正的挑战。这种需求同时来自行动和数据中心应用。由于电池寿命的限制,以往对于能源效率的需求显而易见,未来还会变得更重要。ag5EETC-电子工程专辑

由于深度学习而打造的DSA芯片应该可以为数据中心优化性能、成本和能效。除此之外,其芯片需要在前向传播时“晃动”数据,为用于矩阵/向量计算的处理器实现优化。以“目标”比较所取得的数据,然后再将“错误数据”“甩”回内存,以便用于下一个收敛周期。除了每秒Tera浮点运算(TFLOPS)的处理器之外,还需要越来越快的片上高速缓存,才能处理这种巨大的数据移动。ag5EETC-电子工程专辑

在许多此类DSA芯片平行运作的环境(例如数据中心)中,过程中如果效率不彰将导致数千安培的电流从主电源流向地面。这些大量浪费的漏电流自然会导致庞大的成本浪费。ag5EETC-电子工程专辑

对技术发展的影响

当代技术的发展带来了资料泛滥。它最主要的成长动力来自物联网(IoT)、5G人工智能(AI)、扩增实境和虚拟现实(AR/VR)以及自动化。在大多数情况下,由于速度和能量的原因,数据必须储存在靠近CPU的位置,意即与CPU核心位于同一芯片上。唯一一种能够如此接近CPU的内存就是SRAM。ag5EETC-电子工程专辑

然而,SRAM由于效率不彰的尺寸和漏电流本质,导致这些成长驱动力的发展瓶颈。SRAM引起的速度和功率限制,阻碍了这些应用的明显进展,同时还不断地提高成本。这导致对于各种新兴内存替代技术的需求和投资与日俱增——特别是需要高效率的SRAM替代内存。ag5EETC-电子工程专辑

编译:Susan Hong,EET Taiwanag5EETC-电子工程专辑
ag5EETC-电子工程专辑

编按:本文作者Andrew Walke是Spin Memory [原Spin Transfer Technologies]产品营销副总裁ag5EETC-电子工程专辑

 ag5EETC-电子工程专辑

 ag5EETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣的文章
  • 从英特尔多芯片封装架构布局看先进封装产业发展趋势 先进封装技术能够集成多种制程工艺的计算引擎,实现类似于单芯片的性能,但其平台范围远远超过单芯片集成的芯片尺寸限制。这些技术将大大提高产品级性能和功效,缩小面积,同时对系统架构进行全面改造。因此,得益于对更高集成度的广泛需求、摩尔定律的放缓、以及交通、5G、消费类、存储和计算、物联网(包括工业物联网)、人工智能(AI)和高性能计算(HPC)等大趋势的推动,先进封装逐步进入其最成功的时期……
  • 长电科技CEO辞职,原NXP高管郑力接任 据最新消息显示,恩智浦大中华区总裁郑力离职,加入国内的封测巨头长电科技,担任CEO一职。长电原CEO李春兴先生请求辞去CEO及第七届董事会董事职务后,将继续担任公司首席技术长职务。
  • “记录,就是用来被打破的”:华为麒麟990堆103亿晶体管重 2017年,麒麟970,全球首发集成AI NPU单元,成为首个人工智能移动计算平台,开启端侧AI新纪元;2018年,作为华为历史上投入最多、创新力度最大、成本最高、挑战最大的人工智能手机芯片,华为麒麟980横空出世,并创下“六个全球首款”的历史记录。然而,“记录,就是用来被打破的。”
  • GlobalFoundries告台积电其实是为了…… 通路商对其供应商的零组件所采用之技术并没有直接的影响力,因此GlobalFoundries控告台积电侵权、把后者的客户也一并列入被告名单之主要目的,应该是为了要让台积电客户施压台积电尽快与其达成和解。
  • 全球首款碳纳米管通用计算芯片问世!采用RISC-V架构 硅晶体管已经在计算机行业中存在了几十年,但正如摩尔定律所预测的,硅性能正达到一个临界点。碳纳米管被认为是替代硅材料首选,他有着优异的力学和电学性能,但存在一系列设计、制造和功能上的问题令科学家们头疼。如今这些问题被麻省理工的团队攻破,他们利用14000多个碳纳米管晶体管,采用了 RISC-V 架构,制造出了16位微处理器……
  • 压着130份供货申请不审,3000亿美元中国商品关税倒是提 距离美国将华为列入“实体清单”已过去3个多月,美国公司要求恢复与华为正常商业往来的呼声越来越高。据《路透社》报道,美国商务部已收到超过130份公司的申请要求获准向华为出货,但特朗普一直按住不批。与之形成鲜明对比的是,上周宣布3000亿美元中国商品关税上调到15%的决定,不到一周就被确认了。见此景,已经退休的台积电创始人张忠谋都忍不住发声……
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告