基于阻变存储器(RRAM)的存内计算技术是实现nvCIM的有力竞争者。通过将神经网络中的权重矩阵部署到RRAM交叉阵列上,利用欧姆定律和基尔霍夫定律加速矩阵向量乘法计算,可显著降低数据在计算和存储单元之间的搬运,从而增加系统的推理速度和能效。但现有的nvCIM架构在匹配边缘AI系统方面还存在一些挑战……

近年来,非易失性存内计算(nvCIM)作为一种新兴的体系架构,为在资源有限的边缘系统中处理数据密集型的人工智能(AI)任务提供了可能。基于阻变存储器(RRAM)的存内计算技术是实现nvCIM的有力竞争者。通过将神经网络中的权重矩阵部署到RRAM交叉阵列上,利用欧姆定律和基尔霍夫定律加速矩阵向量乘法计算,可显著降低数据在计算和存储单元之间的搬运,从而增加系统的推理速度和能效。但现有的nvCIM架构在匹配边缘AI系统方面还存在一些挑战:软件方面,由于传统深度学习算法所需的精度高,导致存储和计算成本的提升;硬件方面,模数转换器(ADC)和灵敏放大器(SA)等外围电路的使用大幅增加了芯片的面积和功耗。

针对这些问题,微电子所微电子器件与集成技术重点实验室刘明院士团队开发了一款面向二值神经网络(BNN)的数字型RRAM宏级存内计算芯片(3T2R-Macro)(图1a)。通过使用分压原理映射二值神经网络权重矩阵,利用反相器将乘加计算结果量化为稳定的电压输出。该设计省去了外围ADC或SA,有效减少了芯片面积、能耗和延迟,提高了对噪声的鲁棒性。团队还利用软—硬件协同设计方法,通过调节反相器供电电压,实现了3T2R-Macro片上二值卷积神经网络模型中批量归一化(Batch Normalization)和激活函数(Activation)计算(图1b)。该3T2R-Macro设计在CIFAR-10和MNIST数据集上分别实现了86.2%和95.6%的识别率(图1c)。180 nm工艺节点仿真结果表明芯片最小计算延时为8 ns(图1d),峰值能效为51.3 TOPS/W(图1e)。相较于已报道的基于电流累积型模拟nvCIM设计,3T2R-Macro节省了10%的芯片面积和30%乘加计算能耗,提升了20%系统鲁棒性。这一研究结果为在资源有限的边缘系统部署AI任务提供了一种高效的解决方案。

该项目得到了科技部、国家自然科学基金委、中科院和香港大学的支持。成果近期发表在IEEE Transactions on Circuits, Systems II: Express Briefs(TCAS-II)期刊上(DOI: 10.1109/TCSII.2022.3233396),微电子所博士研究生李熠为文章的第一作者,香港大学王中锐博士和微电子所尚大山研究员为该文章的共同通讯作者。  

  图1. (a) 3T2R-Macro 结构、工作原理与电压输出结果;(b) 二值卷积神经网络片上批量归一化和激活函数功能实现;(c)3T2R-Macro在MNIST和CIFAR-10数据集上识别率;(d)3T2R-Macro的操作延迟;(e)3T2R-Macro与已报道的电流累积型nvCIM设计的芯片功耗对比

  论文信息:

  https://doi.org/10.1109/TCSII.2022.3233396

  An ADC-less RRAM-based Computing-in-Memory Macro with binary CNN for Efficient Edge AI

  Li Yi, Chen Jia, Wang Linfang, Zhang Woyu, Guo Zeyu, Wang Jun, Han Yongkang, Li Zhi, Wang Fei, Dou Chunmeng, Xu Xiaoxin, Yang Jianguo, Zhongrui Wang,* Dashan Shang*

  IEEE Transactions on Circuits, Systems II: Express Briefs (TCAS-II)(2023)

  DOI: 10.1109/TCSII.2022.3233396

责编:Luffy
阅读全文,请先
您可能感兴趣
自从AspenCore分析师团队去年发布《30家国产无线连接(蓝牙/Wi-Fi/NB-IoT/LoRa)芯片厂商调研报告》以来,无线连接技术和市场都发生了很大变化,比如WiFi 6的快速渗透,蓝牙LE Audio的应用,以及新兴的超宽带(UWB)技术及应用。此外,国产无线连接芯片厂商格局也有不小的变动,我们汇编收录的厂商也从30家增长至55家。
AspenCore分析师团队在已经发布的2022 Fabless 100排行榜电源管理芯片(PMIC) Top 10和《35家国产电源管理芯片厂商调研分析报告》基础之上,采集15家国产电源管理芯片上市公司的2022财年上半年财报数据、11家已经提交IPO申请并获受理的PMIC公司招股说明书,以及国产电源管理芯片厂商调查问卷的统计结果,汇编出这份综合性评估分析报告。
2022 中国IC设计 Fabless 100 排行榜,由安谋科技独家冠名支持。 AspenCore分析师团队在调研分析“2022 中国IC设计 Fabless 100 排行榜”时也做了较达的调整。鉴于上市公司越来越多,我们将原来10大类别中的“上市公司(Public)”和“”初创公司(Startup)剔除,改为10大技术类别,分别是:AI芯片、MCU、电源管理(PMIC)、无线连接(Wireless)、模拟芯片(Analog)、处理器(Processor)、传感器(Sensor)、存储器(Memory)、功率器件(Power),以及通信网络(Communication)。
由AspenCore全球分析师团队倾力打造的China Fabless 100排行榜将在国际集成电路展览会暨研讨会(IIC)的IC领袖峰会上隆重发布。今年的Fabless 100排行榜共分10大类别,每个类别筛选10家综合实力和增长潜力最强的国产IC设计公司。这十大类别分别是:AI芯片、MCU、电源管理(PMIC)、无线连接(Wireless)、模拟芯片(Analog)、处理器(Processor)、传感器(Sensor)、存储器(Memory)、功率器件(Power),以及通信网络(Communication)。
在2022年全球MCU生态发展大会上,最后的圆桌讨论主题是:如何动态平衡MCU产能与市场需求?
AspenCore分析师团队根据国产MCU常说的调查问卷统计结果,采用专有的量化模型对50家国产MCU厂商进行综合实力排名,主要排名参数包括2021年营收和利润、公司总员工人数和研发人员人数、研发投入占营收的比例,以及累积专利数量等。
德州仪器首席执行官Rich Templeton当选SIA副主席
由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
技术先进的CMOS图像传感器供应商思特威,正式推出面向高端智能安防应用的Star Light (SL) Series超星光级系列大靶面8MP图像传感器新品——SC880SL。
移远通信将摩尔斯微电子的业界体积最小、速度最快、功耗最低的IEEE 802.11ah标准SoC集成到新模块中
当下,正处于汽车“功能机”向“智能机”变革的关键期,以奔驰为代表的传统汽车厂商,如果不能搭上智能化发展的“快车”,很有可能出现类似诺基亚一样被时代抛弃甚至淘汰的命运。在此背景下,奔驰开展了一系列“自救
本期导读✦伴随信息技术的快速发展与广泛应用,智慧城市概念越来越引人关注。智慧城市是依据科学合理的城市发展理念,利用最新信息技术——泛在互联网和信息全面感知——实现人、物、城市功能系统之间的无缝连接与协
“机器人”成为两会高频词。文|网络作为“制造业皇冠顶端的明珠”,机器人的研发、制造、应用是衡量一个国家科技创新和高端制造业水平的重要标志。在2023年全国两会期间,代表们也对机器人行业发展提出了一些建
关注公众号,点击公众号主页右上角“ ··· ”,设置星标,实时关注智能汽车电子与软件最新资讯来源:第一电动网在近期燃油车降价潮,新能源车保价潮之际,很多消费者都在猜测还有哪些车企会降价,以及哪些车企会
关注公众号,点击公众号主页右上角“ ··· ”,设置星标,实时关注智能汽车电子与软件最新资讯来源: 佐思汽车研究 佐思汽研发布《毫米波雷达数据报告-2023年3月版》,报告依据佐思汽研数据库,对当前毫
大家好,公众号【一起学嵌入式】运营有一段时间了。非常感谢大家的关注!公众号创立之初,一直坚持的宗旨是,一起学习,一起成长。希望借此公众号作为嵌入式技术的分享和交流平台,当然也是这样做的。我从学习单片机
基本的晶体管开关电路饱和开关的问题点:关断延时时间如图1所示,使场效应晶体管开关动作时,加给晶体管的基极电流IB:IB=IC/hFE。晶体管饱和动作时,如图2所示,基极电流IB,即使为0,晶体管也不能
2023年3月16日,全程供应链数字化解决方案及SaaS服务商洞隐科技宣布完成超亿元A轮融资,投资方为普洛斯旗下隐山资本。本轮融资将支持洞隐科技在供应链SaaS领域的持续技术创新,助推供应链数字化能力