广告

国产AI芯片的设计挑战

时间:2022-04-25 17:12:00 作者:顾正书 阅读:
除了制造环节会外包给foundry和封测厂之外,一个芯片设计公司需要做好芯片定义、设计(包含芯片、系统和软件)、寻找客户(渠道建设)几个环节。简单地说,就是要明确:做什么芯片?怎么做出来?怎么卖出去?无论拥有成熟品牌的大型公司,还是初创公司,同时做好上述三点都是一个很大的挑战。
广告

芯片是一个产品,同时也是一个服务于商业客户的行业,AI芯片自然也不例外。一个芯片从无到有通常需要经过定义、设计、制造和流通几个重要环节,除了制造环节会外包给foundry和封测厂之外,一个芯片设计公司需要做好芯片定义、设计(包含芯片、系统和软件)、寻找客户(渠道建设)几个环节。简单地说,就是要明确:做什么芯片?怎么做出来?怎么卖出去?无论拥有成熟品牌的大型公司,还是初创公司,同时做好上述三点都是一个很大的挑战。

那么,在AI芯片的不同阶段(规划、设计、验证、流片、板卡/系统集成、应用方案)分别面临什么挑战?

  • 规划阶段。最大的挑战是如何明确市场定位,规划出最有竞争力的方向。对于AI芯片设计初创公司来说,在早期阶段就引入战略合作伙伴能更好地理解市场需求,确保开发的AI芯片符合市场需求。同时,在规划阶段就要软件和硬件协同开发,因为AI芯片设计在很大程度上是软件定义硬件。如果硬件对软件和应用需求不友好,单纯从性能指标上看起来可能很好,但却很难实现产品化。
  • 设计及验证阶段。这是整个芯片开发流程中非常核心的部分,也是非常考验工程团队研发能力的阶段。怎么按计划做出符合规划目标的AI芯片是最大的挑战。
  • 板卡系统集成。这是产品化的另外一个关键阶段,再好的芯片如果没有一个稳定可靠的硬件平台,也没有办法交付给客户使用。在保证稳定性及可靠性的前提下,实现最佳的性能和效率比是最主要的追求目标。面向云端AI的高性能芯片大都以加速卡的形式集成到服务器中,整体能耗和使用成本也是客户考虑的一个重要指标。
  • 应用方案。这是连接客户与研发团队的桥梁,要确保研发符合客户的使用习惯,让客户能够以最小的代价就可以导入到其系统设计中。

下面以面向视频处理应用的瀚博半导体为例,来看国内AI芯片初创公司是如何应对这些挑战的。

从算力高低的角度来看,AI芯片的应用领域依次为数据中心(云)、边缘网关或服务器(边)、终端设备(端)。瀚博开发的是面向云端AI推理的大芯片,主要面临以下三大挑战:

  1. 随着摩尔定律的放缓,综合利用各种架构优势的异构运算(heterogeneous computing, DSA架构)成为推动算力增长的新趋势, 但随之而来的是系统架构和软件的复杂性;
  2. 算力越高,通常芯片面积就越大,需要堆积的晶体管数量越多, 这对于达成最佳PPA(性能、功耗和面积)带来了额外的挑战;
  3. 芯片越大越复杂,开发周期、研发成本和制造成本都随之增高,如何精准地定位一个有足够大体量的应用市场是AI芯片公司在运营层面的挑战。

据瀚博半导体联合创始人兼CTO张磊介绍,其创始团队在GPU领域拥有非常丰富的经验,但公司并没有首选做GPU,而是选择通过DSA架构来做面向AI+视频市场的芯片,从而在PPA和成本上具有明显市场优势。同时,相比于很多公司临时招募组建的研发团队,瀚博的创始团队有着多年相互配合的默契,以及大芯片研发和量产的管理经验和实战经验。该公司的第一颗芯片开始测试8分钟即点亮,这是通过完美执行而应对以上三大挑战的一个最好佐证。

为什么选择AI芯片而不是GPGPU?

PC时代随着图形操作系统的出现,大量需要3D图形运算的工具软件和游戏对于浮点运算的要求急剧升高,传统的X86 CPU处理器并不擅长这类任务,于是诞生了更擅长浮点运算的GPU。在这类应用中,系统会把图形渲染等任务offload到GPU上去。随着神经网络研究和应用的发展,GPU中的浮点运算能力在这些领域的应用逐渐发展起来,英伟达敏感地抓住了市场机会,将其GPU在保留传统渲染能力的同时增加了对于通用计算和神经网络运算的能力,并称之为GPGPU。

英伟达的GPGPU是包含渲染以及神经网络(“NN”)运算的。这种架构在同时需要两个能力的应用上会有一定的优势,但很显然对于技术积累要求也非常高。目前一些AI芯片初创公司所自称的GPGPU架构是指没有渲染的NN运算,而有一些声称做GPU的公司则是狭义的渲染GPU,二者都不是通常英伟达所指的GPGPU。英伟达由于有长年渲染GPU的技术积累,同时基于先发优势通过CUDA积累了生态优势,因此选择了GPGPU路线。但是,其他公司在这条路线上与其正面竞争是胜算很小的,即使国际知名公司(像英特尔和AMD)在GPGPU市场与其竞争都有相当的难度。

然而,没有一个技术是完美的,由于GPGPU保留了大量神经网络运算所不需要的单元,在单纯的神经网络运算上并不是最高效的,因此谷歌基于特定域架构(DSA)为自己的特定应用做了TPU。DSA架构给其他芯片公司带来了希望,包括Intel、特斯拉等知名公司都开始在这条路线上发力。

芯片设计是一个国际化的产业,知识产权在其中扮演着很重要的角色。渲染GPU由于发展历史久远,专利壁垒较高,即使与之相关的不带渲染的GPGPU也容易踩雷。相反,DSA由于出现较新,国际大企业和创业公司在知识产权上的差距并不大。选择针对AI+视频市场来做DSA架构的AI芯片,这对瀚博来说也是最明智的选择,其研发团队在视频领域的经验和对于大芯片的驾驭能力也得到了充分发挥。

项目研发团队是如何分工协作的?

瀚博SV100研发团队成员主要来自AMD、Cisco、意法半导体、华为、高通和Microchip等公司,其核心团队都有超过十年的开发协作经验。具体来说,瀚博有架构/IP开发、芯片验证、SoC实现、硅后验证,以及软件5大部门。

架构/IP团队负责芯片的整体架构规划以及核心IP的设计开发,某种程度来说架构和IP直接决定了一个产品的成败;芯片验证团队负责IP以及SoC验证,确保功能和性能符合设计要求;SoC实现团队基于架构设计,将各种IP集成到SoC,并且以尽量小的面积和尽量低的功耗来实现最大的性能;硅后验证团队主要负责芯片的功能性能验证,以及验证板和系统板的开发,同时也负责芯片产品化的各个方面;软件团队负责固件、驱动和编译器等软件方面的开发,可以说硬件定义产品的“身体”,而软件赋予产品的“灵魂”。

国内AI芯片公司相比国际巨头有什么优势和劣势?

与大多数科技行业的企业一样,国内AI芯片公司的最大优势就是贴近市场和客户,近水楼台先得月。中国市场对于AI芯片的发展有如下几个优势:

  1. AI应用本身就是一个新兴市场,很多应用场景都是在摸索中成长的。国内企业在近20年的迅速发展中耳濡目染,对于新鲜事物的尝试意愿是很高的。
  2. 中国近年的数字化基础设施建设带来的红利,比如中国拥有世界上最大规模的宽带及4G/5G通信网络;中国的互联网企业迅速成长为全球巨头,这些都为AI应用创造了良好的发展土壤。
  3. 中国很多传统行业处在转型期,比如中国的工业升级是天然建立在数字化前提上的,这给AI带来了巨大的发展空间。
  4. 国家政策鼓励芯片创业,新基建和“东数西算”等重大工程都为AI芯片公司提供了坚强的后盾。

国内AI芯片企业的劣势在于技术和IP积累不足,具体体现在:软硬件生态、知识产权和人才等方面。

责编:Steve
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
顾正书
ASPENCORE资深产业分析师。以深圳为坐标原点,扫描全球电子和半导体行业。专注于China Fabless和SoC设计细分市场的分析和学习,欢迎交流。
  • 中国首个极大规模全异步众核芯片流片成功,异步电路和同 目前数字芯片的主流设计都是同步电路(Synchronous),这种以时钟信号驱动的流水线结构是现代数字电路的基础。但是随着设计和测试的复杂度的不断提高,加之低功耗设计的需求,在一个实际设计中会出现时钟偏斜、时钟抖动及功耗等问题。异步电路有时也称为无时钟或者自定时电路……
  • 是谁导致了全球芯片荒?有解决方案吗? 除了等待新的晶圆厂上线,您对于IC短缺的原因和解决方案有什么看法?您认为电路重新设计是一种可行的方法吗?系统或整体的产品重新设计可行吗?使用更少的IC呢?其它方法可行吗?或者我们应该再等等?
  • 为何HEDT高端桌面CPU正在消失? 如果将Intel和AMD的CPU产品划分成5个定位,则分别为:服务器、(高端)工作站、HEDT、消费级桌面(台式机)、移动(笔记本)。或许工作站和HEDT在定位上有所重合,在此我们将两者区分为“高端工作站”和“主流工作站”的差别。
  • 系统架构师:半导体产业的新工作蓝图 近来在半导体产业领域,一种新的工作职务——“系统架构师”正在崛起。业界越来越需要系统架构师来协调SoC设计项目的每一个层面…
  • 莲鑫集团下属莲鑫基金拟收购安谋科技51%中方股权,多方 5月18日,莲鑫集团下属莲鑫基金与安谋科技多家中方股东共同宣布,已达成意向并签署意向书,拟收购安谋科技51%股权。据官方新闻,莲鑫集团是一家专注于大湾区科技投资的企业公司,本次为收购安谋科技51%股权专门成立莲鑫基金,目的是把中方股权统筹起来……
  • 实现系统级效能、功耗与面积的3D-IC小芯片设计 在同一封装中将芯片做3D立体堆栈,和使用硅中介层的多小芯片系统2.5D封装,已经成为新的解决方案。当然,这两种方式也面临着各自的挑战。
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。
  • 基于架构创新,后摩智能点亮业内首款 5月23日,后摩智能宣布,其自主研发的业内首款存算一体大算力AI芯片成功点亮,并成功跑通智能驾驶算法模型。
  • Nexperia和KYOCERA AVX Componen 将成熟的GaN技术与创新型封装专业知识相结合
  • 华为鸿蒙系统领路人王成录被曝离职! 芯片验证春季班开班!1750元补助即将收尾!就业畅销课《芯片验证从入门到精通》5 月 23 日消息,消息称华为鸿蒙领路人、华为终端 BG 软件部总裁王成录博士已经离开华为,目前其个人微博的官方认证也已
  • STM32的SPI外设片选只有一个怎么破? 之前用STM32的SPI需要控制很多外部芯片,可是一个SPI的外设只有一个片选,如果想实现独立片选一主多从,又该怎么实现呢?SPI总线拓扑 一般来说,SPI总线按照下图方式进行连接,一主多从。如上图所
  • 125周年校庆,细数「浙大系」的传感大佬们! 据悉,浙江大学微纳电子学院(微电子学院)成立于2015年5月15日。2015年7月,经教育部等六部门联合发文,浙江大学微电子学院批准为首批国家示范性微电子学院。其实浙江大学的半导体相关学科历史悠久。据
  • 放大器电源知识点汇总!课代表带你划重点! 课代表笔记来啦——  放大器电源的那些事儿 Part.1  ——学霸笔记妙,学习更高效😏正值《放大器电源的那些事儿》第二部分上线ADI为大家带来课代表笔记助您更快掌握放大器电源知识!点击可查看 每部分
  • 未来将超千亿级市场规模?这个垂直赛道值得关注|爱分析报告 注:点击左下角“阅读原文”,直接参加报名。厂商全景报告实践报告联系我们
  • 【网友好帖分享】“PIC18F16Q41CuriosityNano评估工具包”网友测评9 “Curiosity Nano测评报告”好贴分享又来了。本期我们分享的是网友mxkw0514的“【CuriosityNano测评报告】OPA外设放大模拟小信号测评 ”。mxkw0514在帖子中提及他已
  • 博通考虑收购VMware 芯片验证春季班开班!1750元补助即将收尾!就业畅销课《芯片验证从入门到精通》根据路透社报道,芯片制造商博通(Broadcom)正在洽谈收购云计算公司VMware。消息人士透露,博通和VMware 正
  • 具较高电流SIO通道的四通道IO-Link主控器,认识一下? IO-Link 是一项针对工业应用中智能传感器和执行器点对点三线式接口的通信标准。IO-Link 把这些器件的传统接口能力从简单的 NC/NO 开关接口 (标准 IO 或 SIO 模式) 扩展到双向智
  • 磨合期那些痛苦的事... 换工作,最难度过的是与新单位,新领导,新同事的磨合期。一旦熬过了那个时期,获得领导和同事的认可,后面的日子就比较好过了。孙工刚来到这个单位没多久,正在经历这个时期。领导让他找个射频收发芯片。要求是:工
  • vcs实用技巧 本节主要介绍:vcs常用选项vcs仿真流程vcs代码覆盖率vcs综合后后仿图一乐技巧VCS是编译型verilog仿真器,VCS先将verilog/systemverilog文件转化为C文件,在linu
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了