广告

2022国产AI芯片报告之一:10大国产AI芯片

时间:2022-03-20 18:09:11 作者:顾正书 阅读:
作为《2022年45家国产AI芯片厂商调研分析报告》的一部分,AspenCore分析师团队汇编整理了10款国产AI芯片和10款国际AI芯片,以展示全球AI芯片的最新技术发展。
广告

作为《2022年45家国产AI芯片厂商调研分析报告》的一部分,AspenCore分析师团队汇编整理了10款国产AI芯片和10款国际AI芯片,以展示全球AI芯片的最新技术发展。

Top 10国产AI芯片分别来自如下厂商:寒武纪、地平线、昆仑芯科技、阿里平头哥、燧原科技、瀚博半导体、天数智芯、鲲云科技、黑芝麻智能和芯擎科技。

在“AI芯片”报告的调研和汇编过程中,处理器IP领导者安谋科技、国产EDA公司合见工软,以及领先的国产AI芯片设计公司瀚博半导体给予了极大的支持,在此深表感谢!此外,安谋科技董事长吴雄昂先生与合见工软联席总裁徐昀女士还将参加上海IIC展会并在IC领袖峰会发表主题演讲。

寒武纪第三代云端AI芯片思元370

思元370基于7nm工艺,集成390亿个晶体管,并采用chiplet(芯粒)技术,其最大算力高达256TOPS(INT8),是思元270算力的2倍。基于最新智能芯片架构MLUarch03,集AI训练和推理一体的思元370实测性能表现优秀:以ResNet-50为例,MLU370-S4加速卡(半高半长)实测性能为同尺寸主流GPU的2倍;MLU370-X4加速卡(全高全长)实测性能与同尺寸主流GPU相当,能效则大幅领先。

思元370在一颗芯片中封装2颗AI计算芯粒(MLU-Die),每个MLU-Die具备独立的AI计算单元、内存、I/O以及MLU-Fabric控制和接口。通过MLU-Fabric保证两个MLU-Die间的高速通讯,而不同MLU-Die组合规格可实现多样化的产品,为用户提供适用不同应用场景的高性价比AI芯片。

地平线整车智能计算平台征程 Journey 5

征程5是地平线第三代车规级AI芯片,采用TSMC 16nm FinFET工艺,遵循 ISO 26262 功能安全认证流程开发,并通过ASIL-B 认证。基于最新的双核BPU贝叶斯架构设计,征程5采用八核 Arm Cortex-A55 CPU集群,可提供高达128TOPS等效算力;CV引擎,双核DSP,双核ISP,强力Codec;支持多路4K及全高清视频输入及处理;双核锁步MCU,功能安全等级达 ASIL-B(D);符合AEC-Q100 Grade 2车规级标准。

该芯片面向高级别自动驾驶及智能座舱应用,其外部接口丰富,可接入超过16路高清视频输入,并支持双通道“即时”图像处理;依托BPU、DSP和CPU资源,不仅适用于先进的图像感知算法加速,还可支持激光雷达、毫米波雷达等多传感器融合;具有PCIe 3.0 高速信号接口,双路千兆实时以太网(TSN) 为多传感同步融合提供硬件级支持(PTP);支持预测规划以及H.265/JPEG实时编解码。

昆仑芯2

由原百度智能芯片及架构部独立而成的昆仑芯科技推出的第二代云端通用AI芯片采用7nm工艺,基于新一代自研XPU-R架构,其算力为256 TOPS@INT8,128 TFLOPS@ XFP16/FP16,最大功耗为 120W;支持GDDR6高性能显存;高度集成ARM CPU,支持编解码、芯片间互联、安全和虚拟化。

硬件设计上,该芯片是率先采用显存的通用 AI 芯片。软件架构上,昆仑芯2大幅迭代了编译引擎和开发套件,支持 C 和 C++ 编程。此外,昆仑2已与飞腾等多款国产通用处理器、麒麟等多款国产操作系统,以及百度自研的飞桨深度学习框架完成了端到端适配,拥有软硬一体的全栈国产AI能力。该芯片适用云、端、边等多场景,可应用于互联网核心算法、智慧城市、智慧工业等领域,还将赋能高性能计算机集群、生物计算、智能交通、无人驾驶等更广泛空间。

阿里平头哥含光800

平头哥于2019年发布数据中心AI推理芯片含光800,基于12nm工艺, 集成170亿晶体管,性能峰值算力达820 TOPS。 在业界标准的ResNet-50测试中,推理性能达到78563 IPS,能效比达500 IPS/W。

含光800采用平头哥自研架构,通过软硬件协同设计实现性能突破。平头哥自主研发的人工智能芯片软件开发包,让含光800芯片在开发深度学习应用时可以获得高吞吐量和低延迟的高性能体验。含光800已成功应用在数据中心、边缘服务器等场景。

燧原“邃思”2.5云端AI推理芯片

邃思2.5人工智能推理芯片基于第二代GCU-CARA架构,作为云燧i20高性能推理卡的算力核心,具有55mm × 55mm大芯片尺寸,提供从单精度浮点到INT8整型的全精度AI算力;基于HBM2E存储方案,提供819GB/s存储带宽;基于硬件的功耗监测与优化特性,3.5X能效比提升。该芯片可支持视觉、语音、NLP、搜索与推荐等各类应用的模型推理。

新一代“邃思”AI推理芯片采用12nm工艺,通过架构升级,大大提高了单位面积的晶体管效率,可实现与目前业内7nm GPU相匹敌的计算能力。基于12nm成熟工艺带来的成本优势,使得云燧i20加速卡在相同性能表现下性价比更高。

瀚博半导体AI推理芯片SV100

SV100系列芯片(SV102)的定位是面向云端的通用AI推理芯片,其特点主要在高推理性能(单芯片INT8峰值算力200TOPS,也支持FP16/BF16数据类型)、低延时、视频解码性能64+路1080p支持(解码格式支持H.264、H.265、AVS2)。

SV102芯片内部有专门的硬件视频解码单元,其视频处理和深度学习推理性能指标数倍于现有主流数据中心GPU。基于瀚博自研、针对多种深度学习推理负载而优化的通用架构,该芯片可支持计算机视觉、视频处理、自然语言处理和搜索推荐等AI推理应用场景,同时集成高密度视频解码,广泛适用于云端与边缘解决方案,节省设备投资、降低运营成本。

天数智芯GPGPU云端训练芯片

天数智芯基于全自研GPGPU架构的云端训练芯片BI采用台积电7nm工艺,集成了240亿个晶体管,并2.5D CoWoS晶圆封装技术。该芯片可支持FP32、FP16、BF16、INT8等多精度数据混合训练,支持片间互联,其单芯算力可达每秒147T@FP16。

通过丰富的自研指令集,该芯片可支持标量、矢量、张量运算,通过可编程、可配置特性,高效支撑各类高性能计算。这款GPGPU芯片聚焦高性能和通用性、灵活性,为人工智能和相关垂直应用行业提供匹配行业高速发展的计算力,并通过标准化的软硬件生态为应用行业解决产品使用难、开发平台迁移成本大等痛点。

鲲云科技数据流AI芯片CAISA

CAISA芯片采用鲲云自研的定制数据流架构CAISA 3.0,相较于上一代芯片架构在效率和实测性能方面有了大幅提升。CAISA3.0在多引擎支持上提供了4倍的并行度选择,架构的可拓展性大大提高。在AI芯片内,每一个CAISA都可以同时处理AI工作负载,在峰值算力提升6倍的同时保持了高达95.4%的芯片利用率。此外,该芯片在算子支持上更加通用,可支持绝大多数神经网络模型快速实现检测、分类和语义分割部署。

鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,其芯片利用率超过95%,较同类产品提升最高达11.6倍。这种定制化数据流技术不依靠先进的晶圆制造工艺和更大的芯片面积,而是通过数据流动控制计算顺序来提升实测性能,可为用户提供更高的算力性价比。

黑芝麻智能自动驾驶芯片华山二号A1000 Pro

黑芝麻智能 A1000 Pro 采用16nm制程,单芯片INT8算力为106 TOPS,INT4算力为196 TOPS,典型功耗25W,可以满足ISO 26262 ASIL D级别功能安全要求。A1000 Pro 内置高性能 GPU ,可以支持高清 360 度 3D 全景影像渲染,内部可以配置不同数据通路和运算机制,在芯片内部部署互为冗余的双套系统和安全岛校验。

基于单颗、两颗或者四颗 A1000 Pro,黑芝麻的FAD全自动驾驶平台能够满足 L3/L4 级自动驾驶功能的算力需求,支持从泊车、城区道路到高速等自动驾驶场景。

芯擎科技“龍鹰一号”智能座舱芯片

芯擎科技7纳米车规级智能座舱多媒体芯片“龍鹰一号”是由台积电代工生产的7纳米芯片,为智能座舱集成了“一芯多屏多系统”,整合了语音识别、手势控制、液晶仪表、HUD、 DMS 以及 ADAS 融合等功能,可让驾驶人享受更直观、更富个性化的交互体验。

“龍鹰一号”内置8个CPU核心、14核GPU、8 TOPS INT 8可编程卷积神经网络引擎。该芯片达到AEC-Q100 Grade 3级别,采用符合ASIL-D标准的安全岛设计,内置独立的Security Island 信息安全岛,提供高性能加解密引擎,支持SM2、SM3、SM4等国密算法,并支持安全启动、安全调试和安全OTA更新等。强大的CPU、GPU、VPU、ISP、DPU、NPU、DSP异构计算引擎,以及与之匹配的高带宽低延迟LPDDR5内存通道和高速大容量外部存储,为智能座舱应用提供全方位的算力支持。

责编:Steve
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
顾正书
ASPENCORE资深产业分析师。以深圳为坐标原点,扫描全球电子和半导体行业。专注于China Fabless和SoC设计细分市场的分析和学习,欢迎交流。
  • 移动应用开发的未来是什么? 在智能手机如此普及的今天,人们时常忘记移动应用是“新事物”。目前还没有任何移动应用开发放缓的迹象。人工智能(AI)、VR、AR和区块链等新兴技术正在不断影响移动应用开发的进程,手机和可穿戴设备上的应用已逐渐渗透到人们的生活。那么,移动应用开发的未来是什么呢?
  • 深入浅出讲解『人工神经网络』的原理和运行机制 深度学习,(人工)神经网络等概念在随处可见的人工智能下现在变得耳熟能详,那么,人工神经网络的原理是什么?它的运行机制是怎样的,涉及到了哪些高深的“概念”?其实很简单,本文将用深入浅出的方法为您介绍神经网络,绝对让您也能轻松了解它!(如果您很在意结果,可以先看末尾的小结,再回过头来一步一步看)。
  • 谈谈vivo X80手机上的“双芯”是否真的有价值 现在国产手机OEM厂商发布自研芯片时,真正透露的技术细节少之又少,只会给个大致的概念。前几天vivo召开了X80系列手机发布会,以“双芯”为主题,主要是指联发科天玑9000 + vivo自研的V1+芯片。自打手机OEM厂商“自研芯片”大热以来,vivo应用于X70系列手机的V1 ISP芯片就很吸引眼球,V1+即为V1的迭代款……
  • 2022 年人工智能的五大预测 如今,人工智能的发展速度非常快。我们周围事物的复杂性不断增长,这促使每个人都依赖人工智能,以多种方式帮助人类,从检测欺诈交易、预测市场价格到在高层相关者中做出决策。在人工智能蓬勃发展与应用的面前,任何企业都没有理由不尝试人工智能。基于2021年AI技术的发展,可以对人工智能在2022的发展进行预测。
  • 45家国产AI芯片厂商调研分析报告 AspenCore声明:感谢安谋科技、合见工软与瀚博半导体在AI芯片报告的调研和撰写过程中提供专业的技术指导、应用案例分析和行业洞察。我们将邀请来自这三家公司的技术专家参与EE直播间在线讲座:Fabless技术和应用系列-AI芯片的设计挑战与应用市场分析。
  • 中国云计算完全国产化了吗? 在基础云计算laaS方面,我们已经基本实现了独立自主,国产化率达到了45%;在平台即服务云计算PaaS方面,我们在政务方面应该实现了绝大部分的国产化;在软件即服务云计算SaaS方面呢?
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。
  • Porotech动态像素调整技术实现Micr 由于我们彻底巅覆 GaN 的半导体材料和结构技术,让我们突破在单位像素上呈现全光谱颜色。同时,PoroGaN微显示平台的光电特性,简化了电子和光电系统设计集成的过程。目前微米纳米级的Micro-LED 和 Mini-LED 显示器在制造所需的多阶段工艺仍然具有挑战性,凭借 Porotech 的多孔氮化镓 (GaN) 技术和架构平台,可以大幅简化现有质量转移(Mass Transfer)或拾取和放置(Pick-and-Place)等Micro-LED制程。
  • 豪威集团在AutoSens展会上首次推出 OAX4600可实现无缝隙的驾驶员/乘员监控系统功能和灵活的汽车设计,在较小的封装内集成低功耗的RGB-IR ISP和两个NPU 
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了