存算一体技术最早提出是在20世纪70年代,但当时的主流是冯诺依曼中心计算架构。存算一体,简单解释是在存储器中嵌入计算能力,以新的运算架构进行二维和三维矩阵乘法/加法运算,从而避免数据搬运产生的“存储墙”和“功耗墙”,极大提高数据的并行度和能量效率。随着近几年人工智能、云计算、自动驾驶等技术和应用的快速发展,存算一体成为解决在要求大算力、低功耗等终端设备上的关键技术。8月17日,在2022 IIC(国际集成电路展览会暨研讨会)上,后摩智能创始人& CEO吴强博士对存算一体在智能驾驶领域大算力芯片上的技术进行了分析。

存算一体技术最早提出是在20世纪70年代,但当时的主流是冯诺依曼中心计算架构。存算一体,简单解释是在存储器中嵌入计算能力,以新的运算架构进行二维和三维矩阵乘法/加法运算,从而避免数据搬运产生的“存储墙”和“功耗墙”,极大提高数据的并行度和能量效率。随着近几年人工智能、云计算、自动驾驶等技术和应用的快速发展,存算一体成为解决在要求大算力、低功耗等终端设备上的关键技术。8月17日,在2022 IIC(国际集成电路展览会暨研讨会)上,后摩智能创始人& CEO吴强博士对存算一体在智能驾驶领域大算力芯片上的技术进行了分析。

吴强博士 后摩智能创始人 & CEO

吴强博士首先提出,‘’如何用存算一体刷新智能驾驶大算力芯片,里面有两个关键词,一个是存算一体,一个是智能驾驶大算力芯片。”

接着,吴强博士对中国汽车产业正在拥抱的百年未有之大变局进行了分析。

中国汽车产业百年大变局

中国汽车产业正在拥抱百年未有之大变局,未来可能超越欧洲和日本,成为与美国并驾齐驱的汽车强国,现在我们还只是一个汽车大国,还不是汽车强国。智能化是未来汽车发展的趋势。

数据来源:汽车之家研究院、21世纪新汽车研究院《2022中国智能汽车发展趋势洞察报告》

上图是中国汽车智能化的销量和渗透率。2021年智能化是L2级,智能化渗透率在205%左右,2022年可以达到2530%左右,到2025年或接近50%。

智能驾驶芯片设计的挑战

智能驾驶普及落地需要有三个要素:

强智能。要足够的聪明,足够的智能,能把人解放出来,才能有价值。

2、安全性。反映到芯片有具体的要求,首先智能化需要大算力保证,然后还要低功耗,因为汽车是一个嵌入式设备,需要考虑功耗问题。

3、低成本。按照小米雷军的说法,大部分消费者购买的汽车在10-30万人民币之间,自动驾驶要足够便宜才能真正普及。

从芯片设计角度要满足这些需求带来了很多挑战。

首先是是大算力

传统的汽车芯片是MCU,它是以控制为主,算力很小。但是现在的智能驾驶要求几十T、几百T到几千T的算力,L4级别则需要400T以上算力,L5级别需要1000T以上算力。现在最强云端算力是1000-2000T,所以汽车某种意义上来说是行走的超算中心。

怎么在边缘端做出这么大的算力呢?这就提出了很大的挑战。

第二个是低功耗

在云端电力很充足,有空调可以制冷,但是在汽车边缘端(车端)是通过电池供电有限,同时还有液冷散热的问题、成本方面的问题。这些都是面临的挑战。

既要大算力,又要低功耗,这是一对矛盾当前很难实现二者兼顾,特别是在汽车边缘端。

存算一体技术解决大算力与低功耗的矛盾

存算一体,是在存储器中对数据进行运算,从而避免数据搬运产生的“存储墙”和“功耗墙”,极大提高数据的并行度和能量效率。

存算一体芯片技术的发展,恰恰既可以解决面临大算力要求,又能降低功耗的矛盾。因此,它有可能成为解决这些问题的一把金钥匙。

大部分传统的计算架构是冯诺依曼架构,优点是非常灵活,但是面对AI遇到的问题是出现算力瓶颈,同时存在大量数据搬运,所以带来很大的功耗消耗。如果存算一体融合在一起,在存储中做计算,这样既可以突破算力瓶颈,避免了大量的数据搬运带来的功耗问题,同时不依赖于先进工艺。

存算一体完美匹配了智能驾驶大算力需求。

以前做大算力芯片,从来没有考虑散热问题。自动驾驶出现以后,一个芯片动则几十瓦几百瓦,在车端,对散热提出了很高的要求。

散热有三种方式,自然风冷,风扇散热,液冷散热。

从成本上来说,自然风冷是最低的,可靠性也最高,维修成本也低;

风冷散热成本低,但是可靠性比较差,因为电扇很容易坏;

液冷可靠性较好,但是成本非常高。

所以自然散热是性价比最好的一种方式,成本低,非常可靠,维护成本也很低。

如果用传统的冯诺依曼架构来做大算力芯片,想保持自然风冷功耗在15W以内,按照目前的技术大概是15Tops,这样的算力只能做一些很简单的智能驾驶,比如说L1,L2级别,如果做L2+,L2++,L3则很吃力。

如果用存算一体架构,则可能在15W自然风冷功耗之下做出60T甚至更高算力的芯片。

因此,存算一体技术解决了在低功耗下大算力的需求,这是存算一体可以给智能驾驶大算力带来的优势。

“这个是后摩智能的产品路线图,开始我们会用比较成熟的存储介质SRAM-based突破1000T,右边是我们下一代基于新型存储器的产品,比如MRAM,RRAM,可以突破2000T,这是为下一代智能汽车做准备。”吴强博士在分析了存算一体技术的优势后,介绍了后摩智能的产品规划。

存算一体,既涉及到硬件,更涉及到了AI下的机器学习、深度学习等软件算法。吴强博士谈到这方面时表示,“当然有好的芯片,还需要有好的软件,我们的芯片想办法尽可能用类CUDA的编程模式,降低客户应用的开发和迁移成本,这是我们设计软件的基本原则,另外还要兼容主流深度学习框架。针对这方面,我们搭了一个中间层,兼容上层常用的深度学习的应用框架,可以兼容我们自己的硬件,这样可以让客户更轻松实现无成本迁移。”

后摩智能的类CUDA的编程模式

此外,后摩智能的另一个特色是采用软硬解耦的思路,软件与硬件解耦,这样允许客户自定义算子,可以在很大程度上开放性定义自己的算子,定义算法,定义应用软件,这也是未来的发展趋势,是用开放的平台允许客户定义自己的算法。

后摩智能在20221年成功点亮了推出了业内第一款存算一体大算力AI芯片HMTC01。

这在业内第一次用存算一体严格存内计算技术做到了20T的算力(可扩展到200T+),它有足够多的算力,精度可以满足智能驾驶复杂AI场景的需求。在这个芯片上也跑通了智能驾驶常用的算法,完成了11个类别的检测、识别和语义分割。

结语

后摩当前主要聚焦在无人车/机器人以及乘用车自动驾驶,后期将延展到仿生机器人,包括AR/VR,云端推理,它们都有一个共同的特点:足够多的智能需要足够的算力和足够高的能效比的芯片。

分析了存算一体技术,介绍后摩智能在这方面的研发和深耕后,吴强博士进行了总结和展望,“后摩希望成为后摩尔时代打造算力基础的一家公司。在小型机时代是1k/W算力,PC时代是1G/W算力,未来到了万物互联时代,可能是1P/W算力,后摩愿景是希望用更多存算一体技术打造1P/W算力,追逐万物智能的梦想。”

责编:Challey
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
这两年电子产业的一个大热门是AI技术——人工智能。AI/ML技术已经渗透到了很多行业中。新思科技全球资深副总裁、新思中国董事长兼总裁葛群在大会主题演讲中列出2022年最火的几个赛道涵盖了:自动驾驶/ADAS、硅光芯片、量子计算、XPU、新能源、AR/VR、类脑芯片。
小米自动驾驶技术已进入测试阶段。8月初,小米披露自动驾驶路面测试的实拍视频,展示了多种功能引发业界关注。9月6日,小米汽车科技有限公司公开“自动驾驶系统及自动驾驶控制方法、装置、车辆、设备”专利,这是继2021年北京小米移动软件有限公司公布自动驾驶专利后,小米再次展示专利,含金量如何?小米汽车专利布局如何?我们来看看……
瑞萨电子宣布已达成最终协议,以全现金交易方式收购位于印度班加罗尔的无晶圆半导体公司Steradian,此次收购预计将于2022年年底完成,收购Steradian的雷达技术将使瑞萨电子扩大其在雷达市场的影响力......
苹果公司前工程师张晓浪在美国加州圣何塞联邦法院就一项刑事指控认罪。根据加州圣何塞联邦法院的电子摘要,张晓浪在周一的听证会上承认了一项窃取商业机密的指控。法官已下令将他的认罪协议封存,将在11月14日作出判决。张晓浪面临最高10年监禁和25万美元的罚款......
chiplet最先落地的三大应用场景将是平板电脑、自动驾驶、数据中心。“两年前我们做高端应用处理器,从SoC到chiplet,当时就是想验证一种新的连接办法,不是追求处理器更快,也不是存储更大,而是验证chiplet一种更有效的方式。”
自动驾驶系统、混动汽车、电动汽车、激光雷达、高级驾驶辅助系统、互联车载信息娱乐系统,所有这些词汇都预示着汽车领域的一场革命。随着这场革命的来临,揭示了汽车电子接口的一个发展新趋势,就是现有接口能力已严重不足,呼唤更快和更智能的接口标准。
由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。

OPPO K10x搭载5000mAh大容量电池与67W超级闪充,一次充电可带来1.3天的续航使用,同时,OPPO 67W超级闪充方案,33分钟即可从1%充到80%。搭载120Hz LCD高刷屏和高通骁龙695 5G移动平台,采用金刚石智冷散热系统,4种不同的散热材料搭配4颗温度传感器,在手机散热的同时,实时感知手机温度并进行智能控温,大幅提升手机温控效果。
海洋光学(Ocean Insight)与等离子蚀刻技术的领先创新者合作,探索适用于检测关键晶圆蚀刻终点的全光谱等离子监测解决方案。

点此查看:2022年PCB行业创新分享会通知广告分割线近日,在相关政府网站上显示,江西省江铜铜箔科技股份有限公司(以下简称:江铜铜箔)通过IPO辅导验收。9月3日,中信证券发布了《关于江西省江铜铜箔科
虽然全球消费电子市场今年下半年遭遇库存去化窘况,整体销售看淡,但是在未来 5G 通讯、IC 载板需求仍不断涌现,商机带动 PCB 材料业努力向前,上游包括铜箔基板厂、玻纤布、FCCL 厂都在加速投资中
--关注回复“40429”--↓↓领取:《汽车驾驶自动化分级》(GB/T 40429-2021)↓↓2021年11月,国外的滑板底盘公司Rivian正式上市;12月,国内悠跑科技也发布了悠跑UP超级底
免责声明:内容如有侵权,请联系本部删除!(手机微信同号15800497114)来源:中科智芯近日,江苏中科智芯集成科技有限公司二厂智芯集成进入设备入场安装阶段。本次入场设备化镀机分为六个单元,目前该设
9月15日晚,广汽埃安旗下的超跑车型 Hyper SSR 正式发布,该车型号称是“中国第一超跑”,零百加速仅需1.9秒。值得一提的是,该车将搭载900V SiC电驱。据“行家说三代半”此前报道,7月1
就像是每个人都有最喜欢的菜,最爱听的歌,最推崇的书.....在咱们半导体行业也总有那么些芯片让攻城🦁们梦萦魂牵,爱不释手前不久在ADI中文技术论坛中,“分享出你心目中的‘顶流’”的活动引起了广大工程🦁
9月14日消息,据业内爆料称,联想自研芯片已经流片成功,采用了5nm工艺!消息称,联想全资子公司鼎道智芯研发的5nm芯片已经回片并在最近点亮,也就是说流片成功,接下来可以进入规模量产阶段。下一步将会进
做一个小项目 - 用小脚丫FPGA来测光,体会如何用全数字器件测量模拟信号。测量环境光的变化最简单、便宜的器件就是LDR,也称之为光敏电阻,适用于检测环境光的强度和环境的亮度。由于它体积小巧、便宜,易
点此查看:2022年PCB行业创新分享会通知广告分割线拼搏三季度,江西九江经开区积极统筹疫情防控和经济社会发展,全力推进重点项目建设,以奋进姿态迎接党的二十大胜利召开。金秋时节,仁创艺电子项目现场一派
免责声明:内容如有侵权,请联系本部删除!(手机微信同号15800497114)来源:金港潮今天上午,默克半导体一体化基地在张家港保税区正式开工奠基。江苏省副省长方伟,省政府副秘书长黄澜,省商务厅厅长陈