广告

高能低耗易部署,爱芯元智AX650N成Transformer最佳落地平台

时间:2023-05-30 作者:爱芯元智 阅读:
相比于在云端用GPU部署Transformer大模型,在边缘侧、端侧部署Transformer最大的挑战则来自功耗,这也使得爱芯元智兼具高性能和低功耗特质的混合精度NPU,成为端侧和边缘侧部署Transformer的首选平台,而其优越性能则决定了Transformer的运行效果。

近来,ChatGPT成为社会各界关注的焦点。从技术领域看,ChatGPT的爆发是深度学习领域演进、发展和突破的结果,其背后代表着Transformer结构下的大模型技术的飞速进展。因此,如何在端侧、边缘侧高效部署Transformer也成为用户选择平台的核心考量。

2023年3月,爱芯元智推出了第三代高算力、高能效比的SoC芯片——AX650N,依托其在高性能、高精度、易部署、低功耗等方面的优异表现,AX650N受到越来越多有大模型部署需求用户的青睐,并且先人一步成为Transformer端侧、边缘侧落地平台。

Transformer是当前各种大模型所采用的主要结构,而ChatGPT的火爆让人们逐渐意识到人工智能有着更高的上限,并可以在计算机视觉领域发挥出巨大潜能。相比于在云端用GPU部署Transformer大模型,在边缘侧、端侧部署Transformer最大的挑战则来自功耗,这也使得爱芯元智兼具高性能和低功耗特质的混合精度NPU,成为端侧和边缘侧部署Transformer的首选平台,而其优越性能则决定了Transformer的运行效果。

作为人工智能视觉感知芯片研发及基础算力平台公司,爱芯元智始终致力于让更多的实际应用落地。目前大众普遍采用的Transformer网络SwinT,在爱芯元智AX650N平台表现出色:361 FPS的高性能、80.45%的高精度、199 FPS/W的低功耗以及原版模型且PTQ量化的极易部署能力,都让AX650N在Transformer的落地中有着领先的优势地位。

具体来看,361帧的高性能,可媲美汽车自动驾驶领域基于GPU的高端域控SoC;而80.45%的高精度成绩同样高于市面平均水平;199 FPS/W的速度则充分体现出低功耗的特点,对比于目前基于GPU的高端域控SoC,有着数倍的优势;更为重要的,AX650N部署方便,GitHub上的原版模型可以在爱芯元智的平台上高效运行,不需要对模型做修改,亦无需QAT重新训练。与此同时,AX650N支持低比特混合精度,用户如果采用INT4,可以极大地减少内存和带宽占用率,达到有效控制端侧、边缘侧部署成本的目的。这些特性都保证了AX650N作为人工智能算力平台,最终落地效果更好用、更易用,且大幅提升了用户效率。

目前,AX650N已适配包括ViT/DeiT、Swin/SwinV2、DETR在内的Transformer模型,在DINOv2也已达到30帧以上的运行结果,这也更便于用户在下游进行检测、分类、分割等操作。基于AX650N的产品目前已在智慧城市、智慧教育、智能制造等计算机视觉核心领域发挥出重要作用。

接下来,爱芯元智AX650N将会针对Transformer结构进行持续优化,并且探索更多的Transformer大模型,例如多模态大模型,不断让Transformer在爱芯元智平台上得到更好的落地效果。值得一提的是,爱芯元智还将推出相应开发板,满足开发者对Transformer深度研究的需求,探寻更丰富的产品应用。

“爱芯元智将继续努力打造基于芯片+软件的端侧、边缘侧人工智能算力平台,让智能落实到生活的真实场景,最终实现普惠AI造就美好生活的企业愿景”,爱芯元智创始人、CEO仇肖莘女士表示。未来,爱芯元智将在成为人工智能算力平台型公司的道路上继续探索,加速基于Transformer的大模型在端侧、边缘侧落地的节奏,让普惠智能真正落地生根,开花结果。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣的文章
  • RISC-V成“垂直半导体时代”必选项  起步于2010年的RISC-V架构已经度过了最初的蛰伏期,在2022年就已实现100亿颗的出货量,据Asanovic教授预测,未来五年RISC-V将迎来迅猛增长,截止2025年RISC-V处理器核的出货量将达到800亿颗,而这仍是保守估计。“ SiFive企业营销与业务开发资深副总裁刚至坚先生在大会上也同样感叹道,“RISC-V国际基金会的会员数从3年半前即2019年12月份时的435个壮大到现在已经近4000个,几乎是近10倍的增长,RISC-V发展太快了。”
  • 马斯克在2023世界人工智能大会再谈AI:人类要加强AI监管! 有限的人工智能与AGI完全不同,AGI很难定义。AGI是一种超越人类在任何领域智能的一种类型,它的能力比人类更强大,这不仅是一种贡献,也是一种担忧,需要通过监管措施进行监督。马斯克还在致辞中强调了对AI进行监管的必要性,认为全面的人工智能有积极的未来,但也有概率出现负面情况,“我们要尽可能确保这些消极的未来不发生,积极的未来会发生。”
  • 这次不说chiplet的好,来谈谈chiplet的“坏” 无论是性能、灵活性、还是成本,chiplet都体现巨大价值,并能有效延续摩尔定律,故业界对该技术的兴趣越来越大。然而, 该技术一样存在着各式各样的问题。从Chiplet需要面对的问题、“多foundry”生态、应用等角度出发,本文作者对Chiplet技术进行了极为详尽和深入的探讨,旨在通过从反方面揭示问题来提高认知,从而更好地促进该技术的发展。
  • 为边缘设备添加低功耗AI/ML推理 在边缘提供识别复杂模式和快速决策能力的人工智能和机器学习已是大趋势。作为新参与者,MemryX提供了与众不同的解决方案。其处理能力可随着添加芯片而线性扩展,并与基于任何架构的微处理器或微控制器兼容,还独立于操作系统。故作者认为,对于各种需要通过AI/ML模型来传递实时数据的嵌入式边缘设备来说,这是最合适的模型。
  • 黑芝麻智能申请港交所IPO   小米、百度、吉利、上汽等巨头持股 黑芝麻智能成立于2016年,是一家车规级智能汽车计算芯片及基于芯片的解决方案供应商,是博世在国内投资的第一家自动驾驶芯片公司,也是第一个实现国产高性能芯片量产上车的本土企业。公司在L2-L3级ADAS和自动驾驶感知系统解决方案上与产业链开展了一系列商业合作;算法和图像处理等技术已在智能手机、智能汽车、智能家居等消费电子领域布局和商业落地。
  • 在AI加速来临时代,NPU助力大算力应用落地 随着芯片技术的不断进步,NPU将会越来越小、越来越节能,以适应更多的应用场景,为我们带来更多便利和智能化体验。而在韩国政府的支持下,三星为代表的IDM企业联动产业链合作,以推进“K-云计算”(韩国云计算)项目为导向,或许能做出更有性价比的产品,满足未来智能计算的多元化场景。
相关推荐
    广告
    近期热点
    广告
    广告
    可能感兴趣的话题
    广告
    广告
    向右滑动:上一篇 向左滑动:下一篇 我知道了