向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

AI需求带动内存运算架构崛起

时间:2019-03-14 作者:Gary Hilson 阅读:
人工智能(AI)和机器学习正进一步展现硬件和硬件架构如何在成功部署中发挥关键作用;然而,关键的问题在于内存应该要设计在哪里?

EDA-eDM-970x90.gifxjEEETC-电子工程专辑

大数据(big data)应用持续推动内存更密切结合运算资源的架构需求,但人工智能(AI)和机器学习更进一步展现了硬件和硬件架构如何在成功部署中发挥关键作用。然而,关键的问题在于内存应该要设计在哪里?xjEEETC-电子工程专辑

根据美光科技(Micron Technology)最近委托Forrester Research进行的研究发现,有89%的受访者认为运算和内存在架构上密切整合至关重要。Forrester Research的这项调查还发现,针对硬件限制使得AI与机器学习能力受限的讨论中,最常被提及的就是内存和存储技术。超过75%的受访者认为目前的内存与存储技术有必要进行升级或重新架构,才能突破应用上的限制。xjEEETC-电子工程专辑

特别是AI让大数据和分析原已面对的挑战更形复杂,因为机器学习经由神经网络在庞大的数据矩阵上执行乘积累加运算。这些运算不断地重复执行,伴随更多的结果出现,同时从数据处理中学习,最终产生一种每次都能达到最佳路径和最佳选择的算法。xjEEETC-电子工程专辑

美光科技企业策略副总裁Colm Lysaght说,由于数据越来越庞大,取得足够可用内存的常见解决方案就是增加更多的DRAM。这使得性能的瓶颈开始从原始运算转移到数据的所在位置。他说:“内存和存储正是数据所在之处。由于这些庞大的数据组合必须处理,我们只得一再地将其传送至CPU进行处理后返回。”xjEEETC-电子工程专辑

只要找到让运算和内存更紧密结合的方法,就意味着能够更加省电,因为数据不必再密集地来回传送了。Lysaght说,“它还提高了性能,因为更多的处理任务都可以在需要之处才发生。”xjEEETC-电子工程专辑

xjEEETC-电子工程专辑

美光科技认为,诸如DRAM和3D NAND SSD等现有的内存和存储技术,为AI架构提供了可用硬件。该公司同时还研究其他更新的技术,例如许多新创公司也支持的内存处理器(PIM)架构(来源:Micron Technology)xjEEETC-电子工程专辑

Lysaght指出,“有许多不同的方法可以创建更好的架构。例如神经形态处理器,可在内部使用神经网络,并将内部核心数分解为更多的较小核心。他说:由于必须处理大量的资料矩阵,因此,更理想的解决方案是让更多核心周而复始地执行相对简单的运算。”xjEEETC-电子工程专辑
xjEEETC-电子工程专辑
例如一家对开发新架构感兴趣的内存公司Crossbar最近与Gyrfalcon Technology、mtes Neural Networks (mtesNN)和RoboSensing等公司合作,共同成立了一个名为‘SCAiLE’(SCalable AI for Learning at the Edge)的AI联盟,致力于开发一款加速、节能的AI平台。xjEEETC-电子工程专辑

Crossbar策略营销和业务开发副总裁Sylvain Dubois表示,该联盟将结合先进的加速硬件、可变电阻式内存(ReRAM)以及优化的神经网络,共同打造具有免监督学习和事件辨识功能的节能解决方案。xjEEETC-电子工程专辑

Dubois表示,无论是智能音箱、智能相机还是智能电视,许多公司面临的挑战在于希望直接将AI导入装置上,但又不知道如何着手。该联盟的目标就在于提供一个将所有必要部份整合在一起的平台。xjEEETC-电子工程专辑

Crossbar的贡献在于内存——特别是ReRAM,它将透过文本、关键词、GPS坐标以及来自传感器的可视数据(非结构化)等各种输入,以处理在机器学习系统中产生的数据。xjEEETC-电子工程专辑

Dubois还设计了一种内存数组架构,让特定处理程序代码可在边缘装置中,以高度平行的方式针对每一个案例进行读取。他说:“如果彼此匹配,就会知道在边缘装置进行哪些处理。但如果无法顺利匹配,那么就成了我们所说的学习曲线。”xjEEETC-电子工程专辑

在云端执行更多分析

以相机传感器为例,他指出这种系统将会在ReRAM数组的备用位置存储新事件或一组功能。Dubois说:“等到下一次在这台相机面前出现类似的事件时,相机本身就能检测到,而无需在云端进行任何训练。”。xjEEETC-电子工程专辑

因此,Dubois表示,如果出现了需要快速决策的意外事件,例如具有安全顾虑的交通现场时,这提供了一种全然不同的AI处理途径,因为它并不必依赖于云端中的大量训练能力。xjEEETC-电子工程专辑

Forrester Research的研究预期,更多的公司将在公共云和边缘进行分析,从而在边缘实现更多的机器学习。51%的受访者表示目前在公共云执行分析,这一数字预计将在未来3年增加到61%。此外,尽管目前约44%的人开始在边缘进行分析,但Forrester预测,这一比重将在2021年增加到53%。xjEEETC-电子工程专辑

在为美光科技进行这项调查期间,Forrester基础设施和营运产业资深分析师Chris Gardner一开始对于硬件产品大量“涌现”的程度备感惊讶,特别是存储和内存。xjEEETC-电子工程专辑

Gardner说:“我本来预期会看到更多与硬件有关的软件可编程问题,以及管理等问题。当然,这些问题确实也出现了,但并不至于像其他事情的程度。”xjEEETC-电子工程专辑
Gardner表示,在该研究中衍生而出的是内存本身如何完成大量的工作,同时又尽可能避免进行存储。但值得注意的是,对于内存和存储的需求取决于实际的应用类型。据Gardner解释,训练模型需要相当庞大的内存和存储能力,除此之外,你几乎不需要其他任何东西。xjEEETC-电子工程专辑
14ri2.pngxjEEETC-电子工程专辑
Crossbar最近成立了一个打造AI平台的联盟,提供针对AI应用的内存产品,例如其内建嵌入式ReRAM的P-Series MCU(来源:Crossbar Inc.)xjEEETC-电子工程专辑

Gardner说,理想上,企业希望拥有一个容量高达数百GB或TB级RAM的存储环境。但现实上,他们必须自行打造或付费给供货商协助打造,他并补充说,目前业界亟需的是整个硬件典范的转型。xjEEETC-电子工程专辑

Gardner说:“我们需要更多以内存为中心(memory-centric)的架构。”他进一步解释,运算需要以内存为中心,并尽量减少存储的必要性,而不再是以运算为中心。xjEEETC-电子工程专辑

Gardner说:“但这并不表示当今的运算架构及其存取方式很糟糕,而只是强调在执行AI和机器学习方面,它可能不是最有效率的方式。”xjEEETC-电子工程专辑

Forrester的研究内容还涵盖了边缘运算。应用场景之一是内部架设摄影机的主要运动场馆,这些摄影机将产生大量需要快速处理的资料,以确定场是否存在危险情况。Gardner说:“目前虽然可以来回云端传送资料,但并没时间进行分析。他们需要的是尽可能迅速地进行处理。”xjEEETC-电子工程专辑

当然还有一些机器学习任务得在云端中完成,再将其发送回物联网(IoT)装置,但其中的一些装置将会变得越来越智能并自行执行机器学习,接着传回云端共享后再传送到其他装置。Gardner表示,对于内存制造商来说,这意味着商品组件制造商正持续转型以及重新编译应用程序,以善加利用AI和机器学习工作负载所需的新式内存架构。xjEEETC-电子工程专辑

但我们如今仍处于实验阶段,因为还没有任何真正的张量(tensor flow)——使用以内存为中心的架构可以整合在一起;这种以内存为中心的架构要走出实验室之前还得克服很大的延迟挑战。xjEEETC-电子工程专辑

Gardner说:“几十年来,我们一直抱持着以CPU执行的心态。如今这种极具革命性的想法,将有助于我们摆脱这种心态。”xjEEETC-电子工程专辑

去年秋天,美光科技宣布投资1亿美元于AI新创领域。该公司如今已在实验室中开发了一款类似DRAM的产品,目标是在2021年出样,同时,该公司的研究人员也正致力于研究业界新创公司积极探索中的内存处理器(PIM)架构。xjEEETC-电子工程专辑

编译:Susan HongxjEEETC-电子工程专辑

 xjEEETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Gary Hilson
EE Times特约编辑。Gary Hilson是一位自由撰稿人和编辑,曾为北美地区的印刷和电子出版物撰写过大量稿件。 他感兴趣的领域包括软件、企业级和网络技术、基础研究和教育市场,以及可持续交通系统和社会新闻。 他的文章发表于Network Computing,InformationWeek,Computing Canada,Computer Dealer News,Toronto Business Times,Strategy Magazine和Ottawa Citizen。
您可能感兴趣的文章
  • 美光CEO访问紫光,三星海力士如临大敌 据韩国媒体报道,美光(Micron)CEO Sanjay Mehrotra近期到访中国,并造访了中国存储器厂商紫光集团。虽然外界并不了解双方具体谈了什么,但却让韩国两大存储芯片公司三星、SK海力士如临大敌。他们担心美光若与中国半导体厂合作,或是对当地有新投资,都可能造成韩国内存厂的威胁。
  • 中国量产64层3D NAND闪存,明年直上128层! 9月2日,紫光集团旗下长江存储官方宣布,公司已开始量产基于Xtacking架构的64层256 Gb TLC 3D NAND闪存。其实在8月下旬,重庆举办的2019中国国际智能产业博览会上,紫光集团就已经公开展示了该产品。原本预计今年年底正式量产的64层3D闪存,现在提前发布消息,看来进展比预期更为顺利……
  • 精读收藏:掌握『存储领域』动态的38篇文章 本期“轻专辑”为读者回顾总结了38篇存储领域的热门文章,涵盖存储领域技术趋势、竞争格局、市场动态以及设计技巧等。
  • 业内带宽最高的HBM2E DRAM发布,单颗容量16GB SK海力士(SK hynix)宣布,已经成功研发出新一代DRAM内存“HBM2E”,可视为HBM2的增强版,拥有业界最高的传输带宽,相比现在的HBM2提升了大约50%,同时容量也翻了一番。
  • 功耗最低的PCIe Gen4 NVMe SSD控制器面世 新款Marvell SSD控制器系列包括88SS1321、88SS1322和88SS1323,是业内首款采用12nm工艺技术制造的PCIe Gen4 DRAM和DRAM-less SSD控制器。该控制器系列的支持范围涵盖所有现有和新兴的m.2(22110 至 2230)、BGA、EDSFF和U.2 SSD尺寸,是云数据中心服务器计算存储、企业开机驱动设备、PC客户端存储和游戏存储,以及新兴工业和边缘设备应用的理想选择。
  • 适合小型穿戴设备的ReRAM:密度最高,读取电流最低 可变电阻式随机存取内存(ReRAM)为非挥发性内存,藉由电压脉冲于金属氧化物薄膜,产生的大幅度电阻变化以记录1和0。其制程化繁为简,由两电极间简易金属氧化物架构组成,使其同时拥有低功耗和高写入速度的优点。富士通电子推出业内最高密度8Mbit ReRAM,拥有业内最低的读取电流,适合需要电池供电的小型穿戴设备……
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告