热点丨加速边缘生成式AI落地,Arm全新NPU性能提升4倍

AI芯天下 2024-04-15 20:30

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言
生成式AI在经历了一段时间的激烈竞争后,现已步入实际应用阶段。

在此过程中,边缘应用,特别是工业机器视觉、可穿戴设备以及消费者机器人等领域,已逐渐成为其落地实践的核心场景。


作者 | 方文三
图片来源 |  网 络 

边缘AI进化下面临挑战


随着Transformer与大模型技术的持续进步,AI模型的通用性、多模态兼容性和模型微调效率均取得了显著的提升。


同时,低功耗AI加速器和专用芯片的集成于终端设备中,推动了边缘智能的独立性和强大能力。


在视觉和生成式AI应用场景中,如视频解析、图文融合、图像增强与生成、图像分类和目标检测等,Transformer架构展现了巨大的价值。


由于其注意力机制易于利用并行计算,显著提高了硬件利用效率,使得这些模型能够部署在资源受限的边缘设备上。


边缘AI的巨大潜力预示着其将成为多个领域智能化演进与转型的关键驱动力。


①设计边缘AI芯片和系统时,需在计算能力与能效之间寻求恰当的平衡,以确保高效性能的同时,满足功耗和成本限制。


②高性能处理能力往往伴随着较高的功耗,而边缘设备对功耗和成本有着严格的要求。


因此,我们需要在保证性能的同时,尽可能降低功耗,以延长设备的使用寿命。


③随着越来越多的数据在边缘进行处理,数据安全和隐私保护变得尤为关键。因此,边缘AI芯片设计必须包含加密和安全功能,以确保数据的完整性和安全性。


④鉴于边缘AI应用的多样性,为统一多样化的应用需求并实现规模化效益,软件定义和易于软件移植的标准显得尤为重要。



Arm发布新一代Ethos-U AI加速器

随着人工智能技术的不断发展,对高性能计算领域的需求持续上升。作为一种专为深度学习和人工智能应用设计的硬件加速器,NPU的出现标志着AI硬件架构的重大进步。


NPU加速器的崛起,源于人工智能和深度学习算法在各行业的广泛应用,以及对高性能计算需求的持续增长。


对于Arm而言,设计高性能产品并非难事,关键在于如何精准地定义产品。


Ethos-U85与此前同系列产品的一个显著区别在于其对Transformer模型的支持。


通过链化技术,Ethos-U85将元素级运算与先前的运算相结合,从而减少了SRAM在写入和读取中间张量时的需求。


这种优化降低了NPU与内存之间的数据传输量,进而提升了NPU的效率。



作为业界首款AI微加速器,Arm Ethos-U NPU系列一直备受关注。


作为该系列的第三代产品,Ethos-U85专为边缘AI设计。


其优势不仅体现在硬件层面,更在于软件工具链的一致性和易用性。


Ethos-U85为高性能边缘AI应用带来了显著的性能提升和能效改进。


具体而言,它实现了四倍的性能提升和20%的能效提升,同时保持了一致的工具链,为开发者提供了无缝的体验。


该产品支持从128到2048个MAC单元的配置,并在最高性能配置下提供4TOPs的AI算力。这使得其能够应对各种复杂的AI任务。


Ethos-U85的目标应用场景广泛,包括智能家居、零售、工业等新兴边缘AI领域。


它不仅支持低功耗MCU系统中的AI加速,还可在高性能边缘计算系统中与应用处理器、标准操作系统和高级开发语言无缝集成。


这种模式为云原生开发和云边端负载调度提供了有力支持。


值得一提的是,全新的Ethos-U85 NPU还支持TensorFlow Lite和PyTorch等主流AI框架。


除了提供卷积神经网络(CNN)所需的权重矩阵乘运算外,它还能支持矩阵相乘,这是Transformer架构网络的基本组成部分。



Corstone-320全新物联网参考设计平台


Arm公司同步推出了全新的物联网参考设计平台——Corstone-320,该平台致力于推动语音、音频和视觉系统的高效部署。


Corstone-320物联网参考设计平台集成了Arm公司最高性能的Cortex-M CPU——Cortex-M85、Mali-C55 ISP以及全新的Ethos-U85 NPU。


为广泛的边缘AI应用提供了卓越的性能支持,如实时图像分类、目标识别以及在智能音箱上实现具备自然语言翻译功能的语音助手等。


此外,Corstone-320物联网参考设计平台还提供了全面的软件、工具和支持,包括Arm虚拟硬件。


其软硬件一体化的设计使得开发者在物理芯片准备就绪之前即可启动软件开发工作,从而大大加快了产品上市速度,缩短了日益复杂的边缘AI设备的上市时间。


借助Corstone-320预先集成、预先验证的参考设计模板,Arm能够助力合作伙伴有效降低边缘智能芯片的开发成本,缩短开发周期。



Arm旨在瞄准国产CPU市场


Arm中国的工程师正致力于将其NPU驱动程序集成至加速器子系统中,这一举措显示出他们正努力将其技术融入更广泛的行业生态中。


此外,安谋科技推出的[周易]X2 NPU在性能上有了显著的提升,并且支持软件开源,这意味着它能够更加高效地利用CPU、GPU、NPU等多种计算资源。


这种开放性和兼容性对于促进国内CPU产业的进步具有重大意义。


与此同时,海光信息作为国内CPU和DCU领域的领军企业,在信创产业和AI市场的共同推动下实现了迅猛的发展。


这充分表明,国产CPU在市场上的地位正在稳步提升,尤其是在AI领域的强劲需求下。


Arm中国研发的NPU加速器,通过提供高性能、低功耗的专用硬件加速,以及丰富的调试工具和多种层次的开发与调试支持;


为国产CPU提供了强大的技术支撑和优化空间,从而助力国产CPU在AI领域的应用和发展。


这一成果不仅有助于推动国产CPU技术的进步,更能够提升国产CPU在AI领域的竞争力,为实现国产CPU的自主可控和发展提供有力支持。



结尾:


边缘AI将在大模型和生成式AI崛起的背景下,持续提高用户体验,并应对数据量的快速增长。


大模型通过量化、剪枝和聚类技术的不断优化,将更适应在边缘和超级终端设备上部署。


大小模型在云、边、端的协同结合,将成为未来AI产品的重要发展方向,为AI应用在各行业的赋能提供有力支持。


部分资料参考:51CTO:《Arm马健:以新一代 Ethos-U AI加速器及全新物联网参考设计平台》,电子产品世界:《Arm推出新一代Ethos-U AI加速器及全新物联网参考设计平台》,雷锋网:《Arm全新NPU性能提升4倍,支持Transformer,边缘生成式AI时代指日可待》

本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。



END


推荐阅读:


商务合作请加微信勾搭:

18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论 (0)
  • SOT-23和SOT-323都属于小型轮廓晶体管(Small Outline Transistor,SOT)封装系列,是表面贴装设备(SMD)中常见的封装类型。它们主要用于小功率器件,如晶体管、二极管等。尽管这两种封装在应用和外观上有诸多相似之处,但也有一些关键的区别。SOT-23封装SOT-23封装是一种非常流行的小型三引脚封装,它的引脚间距通常为0.95mm。由于其紧凑的尺寸和良好的性能,SOT-23广泛应用于各种低功率应用,如信号转换、放大和开关。SOT-323封装SOT-323封装相比于
    大鱼芯城 2024-05-17 11:36 116浏览
  • 各大Logo更新汇报 | NEW百佳泰为ISO/IEC17025实验室,亦获得国际协会授权,可提供超过30种标准认证测试,特为您整理2024年5月各大Logo的最新规格信息。PCIe▶PCIe6.0 Preliminary FYI研讨会■ 日期:2024年6月3日至7日■ 旧金山机场大使套房酒店,南旧金山,加利福尼亚州Thunderbolt▶更新补贴计划■ TBT3/4 Device: 从2024年4月起, Intel将不再为TBT3/4 Device提供补贴。■ TBT5 Device:- 如
    百佳泰测试实验室 2024-05-16 17:36 114浏览
  • 项目内容描述简略描述:细节需求:1.1.搭建一个开源物联网平台,设置好接受数据。2.上传传感器数据到物联网平台。3.直接传到服务器,通过WIFI,http或者mqtt协议上传。4.通过mqtt网关。5.时间周期为1天。费用为1000元左右。 ...指定区域接包方:无指定区域。项目分析: 1. 开源物联网平台搭建:    - 需要选择一个合适的开源物联网平台作为基础,如ThingWorx, Eclipse IoT, OpenIoT等。    -
    丙丁先生 2024-05-17 08:58 88浏览
  • 在现代化的工业生产和机械设备中,电缆和管线的保护与管理是一项至关重要的任务。电缆和管线作为电能、信号和数据传输的媒介,其安全性和可靠性直接影响到整个系统的正常运行。拖链作为一种灵活高效的电缆与管线保护解决方案,广泛应用于各类机械设备和自动化系统中。本文将对拖链的原理进行详细解析,并探讨其在电缆与管线保护中的应用。 拖链的基本原理 拖链,又称为电缆拖链或电缆保护链,是一种用于保护电缆和管线的链式结构。它通过将电缆和管线放置在一个可弯曲的链状结构中,实现电缆和管线的灵活移动和有效保护。拖链的基本
    MISUMI米 2024-05-16 16:04 122浏览
  • 5月13日小米智能生态官方宣布推出小米人在传感器,并在小米有品众筹上价,众筹价格 119 元,预计零售价格为149元。据介绍,小米人在传感器是一台不用插电的人体存在感知设备,可以实现 " 人在灯不灭,人走关空调 "。主要亮点方面,该传感器采用磁吸设计可随心安装,并采用创新探索新技术,超低功耗毫米波雷达监测算法,1 节纽扣电池可以用 3 年。▲来源:小米有品创新传感器带来突破性家居体验!小米展示了传感器在智能家居中的感知地位传感器在智能化时代,扮演非常重要的角色,是所有感知的源头,在智能家居中更是
    传感器专家网 2024-05-17 10:05 82浏览
  • 一.基本数据类型1.1字节  8位    char  字符型    数值范围(-128,127)         无符号字符型  unchar   数值范围(0,255) 如何理解数值范围?8位存储 【0000 0000】机器识别时将数值转化为二进制补码  即负数最小值【1000 0000】转化为【0111 1111]+1=128又由于其
    烟缈 2024-05-15 21:21 124浏览
  • 步进电机,作为一种将电脉冲信号转化为角位移或线位移的执行元件,因其精确的定位和易于控制的特性,在现代工业控制、机器人技术、精密测量等领域得到了广泛应用。本文旨在深入探讨步进电机的工作原理,以及基于其特性的运动控制基础,为相关领域的工程师和技术人员提供参考。 步进电机的工作原理 步进电机的工作原理主要基于电磁感应和磁场相互作用。其内部包含多个定子磁极和转子磁极,通过控制定子磁极的电流方向和大小,可以产生旋转磁场,进而驱动转子磁极按照预定的角度进行旋转。 电磁感应 步进电机中的定子磁极通常采用
    MISUMI米 2024-05-16 16:02 108浏览
  • 键盘作为人机互动的重要接口之一,经过多年的演进已成为一个相当成熟的产品类别。制造商与用户开始更加注重键盘的设计美学、键帽材质与耐用性,以及敲击时的手感是否符合个人偏好等。对于游戏玩家来说,键盘的手感对于游戏体验有着关键性的影响。良好的键盘回馈不仅能提升操作的准确性,还能在游戏中为玩家提供实时的触感回馈,进而提升游戏表现,而在需要快速反应的竞技游戏中,手感好的键盘则可以成为决定胜负的关键。另一个常用键盘的办公族群,若有具备适中的按键行程、清晰的打字回馈以及舒适手感的键盘,不仅能够减少输入错误率,还
    百佳泰测试实验室 2024-05-16 17:04 125浏览
  • 光电耦合元件作为一种关键的电子元器件,在各种电气设备和系统中发挥着重要作用。然而,对于很多国家来说,依赖进口的情况依然存在。因此,对光电耦合元件的国产替代具有重要意义。本文将从现状和前景两个方面分析光电耦合元件的国产替代情况。光电耦合元件的国产替代现状光电耦合元件是一种将光学和电气两种信号进行隔离的器件,通常由发光二极管(LED)和光敏二极管(光电晶体管)组成。目前,全球光电耦合元件市场主要由一些发达国家的企业垄断,国内市场依赖进口情况较为普遍。然而,近年来,国内光电子领域的发展取得了长足的进步
    腾恩科技-彭工 2024-05-17 16:18 117浏览
  • 额定功耗 / Rated Dissipation    根据 IEC 60115-1/GB 5729 的定义,额定功耗是指在 70摄氏度环境温度下进行耐久性试验,试验结束时,阻值变化不超过试验允许偏差范围所允许的最大功耗。    上面这个定义没有给出具体的耐久性试验时间和允许的偏差范围。这两个参数可以引用另外一个标准—— EN 140401。对于一般电阻器,耐久性试验时长为 1000 小时(约42天),阻值允许偏差范围如下图。“一般”在这里是指热稳定性在2
    电子知识打边炉 2024-05-16 22:30 108浏览
  • 丝杆升降机作为一种常用的升降机构,升降机广泛应用于各种工业、建筑和自动化领域。它以其高精度、高稳定性、高承载能力和易于控制的特点,成为现代机械传动和定位技术中不可或缺的一部分。本文将详细解析丝杆升降机的工作原理及其结构特点,为读者提供深入的理解和应用指导。 丝杆升降机的工作原理 丝杆升降机的工作原理主要基于螺旋传动机构。其核心部件为丝杆(或称为螺杆)和螺母(或称为螺套)。丝杆上刻有螺旋状的齿纹(或称为螺纹),螺母则内嵌有与丝杆螺纹相匹配的螺旋槽。当丝杆旋转时,螺母会沿着丝杆的轴向方向进行直线
    MISUMI米 2024-05-16 16:03 117浏览
  • 光耦技术作为一种高效的电气与光学信号隔离解决方案,在高端智能装配领域展现出了广阔的应用前景。本文将对光耦技术在该领域的应用进行深入分析,探讨其在提升装配设备性能和安全性方面的作用。光耦技术在高端智能装配领域的应用十分广泛。首先,在自动化装配系统中,光耦器件常用于隔离控制电路和传感器电路之间的信号传输,以确保系统的稳定运行。通过光耦技术,可以实现电气信号的隔离传输,避免由于电气干扰而导致的系统故障或误操作。同时,光耦器件具有响应速度快、抗干扰能力强的特点,能够满足高速装配线的需求,提高装配效率和精
    腾恩科技-彭工 2024-05-17 16:15 89浏览
  • 熟悉消费电子市场的朋友或许了解到,最近一家国产CMOS图像传感器企业频频出现,那就是豪威科技——韦尔股份旗下子公司,也是全球第三大CMOS图像传感器企业。曾几何时,旗舰手机的图像传感器主要由索尼、三星提供,也以此为卖点,豪威科技等国产传感器企业的产品只能在低端手机中应用。而近一年来,豪威科技的CMOS图像传感器作为主摄像头,越来越多地出现在小米、荣耀等国产企业的旗舰手机中。而据近期,数码博主数码闲聊站爆料称,华为正在紧锣密鼓的测试豪威 OV50K,今年下半年登场的华为Mate 70系列,主摄传感
    传感器专家网 2024-05-17 10:22 140浏览
  • 车载以太网(Automotive Ethernet)是什么?Automotive Ethernet是指在汽车中使用Ethernet技术的网络。它的发展主要受益于汽车对更多数据和连接性的需求,以支持例如自动驾驶、车辆互联和娱乐系统等先进的车辆功能。其高带宽、低延迟和可扩展性的多项优势,使Automotive Ethernet成为支持复杂系统的理想选择,也让不同的汽车子系统(如传感器、摄像头、控制单元)能够更有效地共享信息。Automotive Ethernet的主要技术Automotive Eth
    百佳泰测试实验室 2024-05-17 10:45 107浏览
  • 一、实验目的了解FIR滤波器的特点,掌握程序算法生成滤波器系数的方法,并实现FIR滤波器滤除高频信号二、实验原理FIR滤波器FIR(Finite Impulse Response)滤波器:有限长单位冲激响应滤波器,又称为非递归型滤波器,是数字信号处理系统中最基本的元件,它可以在保证任意幅频特性的同时具有严格的线性相频特性,同时其单位抽样响应是有限长的,因而滤波器是稳定的系统。因此,FIR滤波器在通信、图像处理、模式识别等领域都有着广泛的应用。有限脉冲响应(FIR)滤波器(N-1阶),不存在输出对
    创龙教仪 2024-05-16 09:30 90浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦