在最新一期的《Nature Electronics》期刊,IBM研究人员描述了一种名为Hermes的推理芯片设计与运作…

在最新一期的《Nature Electronics》期刊,IBM研究人员描述了一种名为Hermes的推理芯片设计与运作;该款在去年首度被打造出来的芯片,内含400万权重,以及64个核心,整合了模拟相变化内存,在读取深度神经网络时能提高速度与省电效益,让IBM得以验证该公司已经在设计的、朝向开发更能自给自足的端对端芯片之想法。

根据位于瑞士苏黎世地区IBM吕施利孔研究中心(Rüschlikon Center)、由研究员Abu Sebastian领军的研究团队说法,“该芯片实现了16.1~63.1TOPS (每秒兆次计算)的矩阵向量乘法(matrix-vector- multiplication)处理量峰值,能源效率为2.48~9.76TOPS W-1。”

该团队成员将他们的芯片与其他几款在过去几年发表的芯片性能基准测试结果进行比较,包括来自台积电/台湾清华大学(TSMC/NTHU)、AI芯片设计企业Mythic、美国普林斯顿大学(Princeton)的设计,以及神经形态芯片NeuRRAM;“尽管该芯片的能源效益通常较低,但相较于所有以电阻式内存为基础的模拟式存内计算(analog in-memory computing,AiMC)芯片,以1.8倍的更高处理量密度表现胜过了效率降低的问题。”

IBM研究团队指出,Hermes在CIFAR-10图像资料库的处理性能上胜过其他任何一款芯片。

存内计算

由于乘法计算扩展的方式(参考图1),深度学习模型的耗电量庞大,输入层的每一个节点在添加至其他节点、馈入下一层之前,必须乘以恰当的权重。因此,如果在第一层(Layer 1)有100个神经元,每一个都连结第二层(Layer 2)的100个神经元,就有1万个权重被储存,每个时间步长(time step)都有1万次乘法计算。

图1:来自某一层的输入乘以个别连结权重,然后下一层的神经元能加总输入(Σ)并执行响应函数(f);在一个每层有m个神经元、完全连结的n层网络中,每次推理的权重,以及权重乘法数量,大概是以平方纳米(nm²)大小来衡量。确切需要多少资源,取决于所需精度的高低;速度有多快,则部分取决于得移动多少权重以执行那些计算。这些都是在资料触及个别神经元取得响应之前。

存内计算(compute-in-memory)是一种模拟电子技术,看来很适合这类应用。首先,模拟架构减少了所需内存组件(device)数量,因为每一个内存组件都能代表多个位──在Hermes芯片,四组件内存能储存8位权重,甚至可能更多。

Hermes芯片实体照。

(来源:IBM Research)

其次,存内计算组件不是用逻辑来执行乘法计算,而是在内存电路本身的内部以电子方式进行:权重在纵横闩阵列(参考图2的黄色部分)被储存为电阻,来自第一层的信号作为电压输入到纵横闩的纵列(column)中(来自输入调变器,图2的橘色部分)。这些输入自然地被乘以权重,沿着交错的横列(row)传送;在其中它们会结合,并由模拟数字转换器(ADC)转换。

相变化的优势与挑战

除此之外,相变化材料──利用局部加热能将非晶体(高电阻)改变为晶体(低电阻)模式──特别适合此类应用。在推理芯片中,权重不应该需要太多改变,因此不需要能量来维持的内存,又一次改善了功耗。

然而,这类材料也有缺点──最重要的是组件不匹配(device mismatch),这导致它们的行为略有偏差。在类似的芯片中,这可以透过将网络载入芯片之后进行重新训练来克服。为避免这种制造后的调整,Hermes芯片采用了一种罕见的ADC配置。

首先,每一个横列都有其转换器(参考图2),这意味着整个阵列向量乘法能平行进行,降低延迟并提高处理量。其次,ADC被用来校准系统,有效消除了一些不匹配;在本地数字处理单元中的其他电路负责了大部份剩余的工作。

研究人员纳入Hermes芯片的另一个组件,是对角选择解码器(diagonal selection decoder,在图2顶部),这能精确隔离他们想要写入的组件,因此改善编程流程。

图2:网络权重在相变化材料纵横闩阵列中,透过编程组件(图顶部的灰色块)进行编程,并取得来自对角选择解码器(diagonal selection decoder,图底部红色块)的协助。一旦完成编程,调变器会从底部透过纵列送出资料,将其乘以权重然后沿着横列相加。ADC以及本地数字处理单元负责转换、校准并对信号做出响应。

(来源:由IBM研究中心发表于《Nature Electronics》的论文图1改绘)

在Hermes芯片上部署网络的研究人员Athanasios Vasilopoulos表示,团队的愿景是扩增通讯网络并将更多种类的数字单元纳入(因此举例来说,它们可以支持Transformer模型)。研究人员还打算将这些部署于能自己执行整个网络模型的更大芯片中,并且与其他芯片搭配运作。

“这同样不会是量产芯片,”Vasilopoulos表示:“那仍将是研究用设备,但可能为这类技术朝向成熟发展开辟一条道路,使其能成为真正的替代方案,但目前它还不是。”

Hermes研究芯片不会提供给IBM社群以外的人使用,但对它有兴趣的人可以透过使用IBM的神经网络训练与推理应用模拟存内硬件加速器(Analog In-Memory Hardware Acceleration Kit for Neural Network Training and Inference),以执行软件模拟的方式来测试该芯片在他们的应用中如何表现。

(参考原文:IBM Research Inference Chip Performance Results Released,by Sunny Bains)

本文同步刊登于台湾版《电子工程专辑》杂志20239月刊

责编:Amy.wu
阅读全文,请先
您可能感兴趣
继AMD在Semicon 2023 上宣布的 4 亿美元印度投资后,近日AMD官宣了在印度班加罗尔开设了其最大的全球设计中心,扩大在印度的研究、开发和工程业务。AMD 印度地区负责人 Jaya Jagadish表示:“印度设计中心于 2004 年成立,只有少数员工。如今,AMD 全球员工的 25% 位于印度,他们支持 AMD 在数据中心、游戏等领域的领先产品的开发、PC 和嵌入式客户。这个新设施标志着我们成长历程中的下一个里程碑,我们将成为半导体进步的重要贡献者。”
在2023临港国际半导体大会上,围绕新能源汽车行业对化合物半导体的需求趋势、亟待突破的技术瓶颈、实际应用误区、以及如何形成本土化差异竞争优势等话题,众多企业高管展开了热烈讨论。
根据一份在中国台湾的安全备案文件中显示,富士康将在印度建设项目投资超过15亿美元。该投资是通过富士康子公司鸿海科技印度大型开发公司进行的,该公司在2015年起就在印度马哈拉施特拉邦注册。同时提交的一份文件称,该子公司将为一个建设项目提供等值的印度卢比预算,以满足“运营需求”。
近日针对戴尔正在考虑将供应链撤出中国大陆的计划,引起市场的广泛关注,并持续发酵。戴尔针对此事做出了回应。戴尔在北京钓鱼台国宾馆举办的进入中国 25 周年庆祝活动上,戴尔全球资深副总裁吴冬梅表示:我们期待未来继续在中国发展。中国一直是戴尔重要的国际市场。
龙架构(LoongArch)从顶层架构,到指令功能等全部自主设计,无需国外授权,得到了上百个与指令系统相关的国际软件开源社区的支持,得到了统信、麒麟、欧拉、龙蜥、鸿蒙等操作系统的支持,得到了WPS、微信、QQ、钉钉、腾讯会议等基础应用的支持,已形成与X86、ARM等并列的基础软件生态。
大家都关心制造,但在未来短时期之内,我们很难在既有赛道下将工艺突破到7纳米以下。解决方案在哪?就是在特殊工艺和封装上开辟新的赛道。
据最新HBM市场研究显示,为了更妥善且健全的供应链管理,NVIDIA也规划加入更多的HBM供应商,其中三星(Samsung)的HBM3(24GB)预期于今年12月在NVIDIA完成验证。而HBM3e进度依据时间轴排列如下表所示,美光(Micron)已于今年7月底提供8hi(24GB)NVIDIA样品、SK海力士(SK hynix)已于今年8月中提供8hi(24GB)样品、三星则于今年10月初提供8hi(24GB)样品。
受智能手机产量下滑,以及品牌厂搭载趋势改变的影响,预估2023年智能手机相机模组出货量年减幅度将再扩大至8.9%,约40.65亿颗。而经过一年的库存去化,在2024年智能手机生产量有望恢复的预期下,明年智能手机相机模组市场有望恢复成长,出货量年增率预估3%,约41.71亿颗。
近日,武汉芯源半导体正式发布首款基于Cortex®-M0+内核的CW32A030C8T7车规级MCU,这是武汉芯源半导体首款通过AEC-Q100 (Grade 2)车规标准的主流通用型车规MCU产品。
1200 V分立器件提供出色的性能,有助于加速全球能源转型
杨浦区人大常委会党组书记、主任程绣明到访新思科技,共话以绿色数字经济开创未来之道11月7日,上海市杨浦区人大常委会党组书记、主任程绣明一行到访新思科技,交流企业如何充分利用政府提供的创新沃土,发挥数字
『这个知识不太冷』系列,旨在帮助小伙伴们唤醒知识的记忆,将挑选一部分Qorvo划重点的知识点,结合产业现状解读,以此温故知新、查漏补缺。在过去十年中,移动无线数据快速增长,使得运营商愈加迫切地需要新频
由亚化咨询主办的第六届半导体大硅片论坛将于12月7-8日在上海召开,来自新昇、超硅、上海集成电路协会、KLA等公司的专家将带来精彩报告工业参观:半导体大硅片企业上海新昇半导体与上海超硅半导体,目前新昇
昨日,比亚迪功率器件和传感控制器件研发及产业化项目一期竣工。这是滨海新区2023年重大项目竣工投产仪式上投资总额最大的项目。据了解,位于马山街道的比亚迪项目是省市县长项目、省千项万亿重大项目,项目总投
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,11月30日,宁德时代首席科学家吴凯在2023国际汽车电子与软件大会·滴水湖峰会上透露,目前,宁德时代旗下时代智能开发的滑板底盘已实现技术突破
2023年11月标准动态英文标准发布IPC-1791D 可信赖的电子产品设计,制造和组装供应商要求适用行业:1. Board Fabricator/Manufacturer2. EMS/Assembl
为什么大陆很多芯片授权分销商都是被动元件起家?韦尔股份是怎么从芯片分销商逆袭成为千亿市值芯片龙头的?为什么说他是芯片分销的集大成者?Smith、Converge、Fusion、Newpower等国际头
第六届半导体大硅片论坛将于12月7-8日在上海召开,来自新昇、超硅、上海集成电路协会、KLA等公司的专家将带来精彩报告工业参观:半导体大硅片企业上海新昇半导体与上海超硅半导体,目前新昇名额已满半导体硅
当我们谈起日本半导体,会想到什么?上个世纪80年代,日本曾是世界最大的半导体生产国。90年代初,全球前10大半导体公司中,有6家来自日本。如今,日本DRAM“国家队”尔必达已经破产,NEC、东芝、日立
由亚化咨询主办的第六届半导体大硅片论坛将于12月7-8日在上海召开。来自新昇、超硅、上海集成电路协会、KLA等公司的专家将带来精彩报告工业参观:半导体大硅片企业上海新昇半导体与上海超硅半导体,目前新昇