随着AGI(通用人工智能)的发展,中国AI算力中心建设正在蓬勃兴起,基于RISC-V架构的DSA新型服务器有可能实现对传统x86服务器的替代。

开源已经成为全球信息技术发展的强大推动力,国际上数以百万亿美元计的开源核心技术生态体系已经形成,越来越多的企业加入开源。

开源模式在实践中已经显示出强大的生命力。近年来在软件领域,开源软件比例不断增加,大有吞噬传统的、封闭源代码软件的势头,尤其是在新兴的人工智能、大数据、云计算等新一代信息技术方面。从行业角度看,越是新兴的行业,开源的比重越大。例如在“互联网和网络基础架构”、“互联网”等行业,开源代码比重已经超过80%;在教育科技、网络安全、营销科技、金融服务和金融技术等行业,开源代码比重已超过75%以上。

基于在软件领域上获得的巨大成功,开源模式已经从软件领域走向硬件领域。

RISC-V精简指令集架构由美国加州大学伯克利分校计算机科学部门David Patterson教授(国灵奖获得者)领衔的团队于2010年发布。它基于广泛使用且十分宽松的BSD许可证(Berkeley Software Distribution license),用户可自由免费地使用RISC-V进行CPU设计开发并添加自有指令集进行拓展,自主选择是否公开发行、或商业销售、或更换其他许可协议、或完全闭源使用。

工艺提升已不能满足处理器速度增长需求

当前摩尔定律(Moore's law)和登纳德缩放比例定律(Dennard scaling)面临失效,英特尔处理器速度增长趋势的变缓,说明不能单纯依靠工艺提升处理器速度。芯片工艺提升虽然能使单位面积容纳的晶体管更多、芯片速度更快,但能耗也迅速增加,降低了多核、微架构等技术的效果。

可见处理器速度的增长已经到达顶点。过去40年里,处理器速度的增长率在上世纪80年代为22%/年,90年代为52%/年,十多年前为12%/年,近年来已将为3%/年。处理器技术亟待创新。

如今,x86架构仍垄断着服务器和桌面领域,这是因为过去几十年里,x86架构在这些领域形成了强大的生态,以致于其他架构因生态较为薄弱而不能取代它,但假以时日这种情况会发生变化。

另一方面,现在的x86架构也已经不是纯粹的CISC(复杂指令集计算机)了,实际上在它内部也用硬件将某些CISC指令转化为内部RISC(精简指令集计算机)指令再予以执行。

中国计算机结构和算法专家,中国工程院院士倪光南

3月14日,在2024玄铁RISC-V生态大会上,中国工程院院士倪光南指出,在后PC时代,CPU架构的竞争力不仅要体现在性能上,还需在芯片面积、能耗、价格、研发周期、生态支持等等方面全方位地体现出来。“以此衡量,x86架构不但在新兴领域没有优势,而且在传统领域市场总量也不会有多大增长,甚至其份额也可能被RISC所蚕食。”

据 Canalys 预测,2024年PC全年出货量预计达到2.67亿台,较2023年增长8%。但未来几年都不会有太大的变化

RISC-V与Arm架构优缺点比较

虽然Arm也是RISC架构,但其出现较早,当时RISC技术还不够成熟,发展至今已背上了沉重的历史包袱。且其知识产权属于一家商业公司,这些都使它难以引领RISC潮流。

RISC-V相比Arm的优势主要有两方面。首先是技术方面:

  • 简单。RISC-V架构的规模比私有的Arm架构小得多。例如ARMv8的手册有2500页(与X86相仿),而RISC-V手册仅有200页;
  • 干净。RISC-V的推出比Arm迟25年,技术新,吸纳了处理器技术发展中的许多经验教训,例如避免了微架构之类依赖于特定技术的特性;
  • 模块化。RISC-V整体架构由一个小而紧凑的标准基础指令集再加上若干标准扩展指令集构成,用户还可以再加上自定义的扩展指令集;
  • 可定制化。为易于扩展而预留很大的操作码空间;便于用户按需自定义扩展指令。

其次是研发和商业模式方面:

  • 采取开源开放模式。RISC-V拥有开源模式和开放标准的固有优势。RISC-V架构现正在RVI开源社区中蓬勃发展,已完成基础指令集和一些标准扩展指令集,更多可选扩展和其他相关支持也在RVI社区和相关方面顺利进行。另外,许多开源社区也设置并支持了与RISC-V有关的项目(尤其是在基础软件等方面),预计将会出现专门从事RISC-V基础软件研发和支持服务的开源社区(如“RISC-V专委会”拟开设“openRVS社区”)。
  • 由基金会等非商业机构支持。RVI社区最初由RISC-V国际开源基金会支持,2019年该基金会迁到瑞士,后改名为RVI国际协会。与追求商业利益的Arm公司不同,支持RISC-V的RVI国际协会以及其他开源基金会、科研机构等等,他们支持RISC-V的目的主要是为了促进处理器技术的发展,以更好地满足世界信息技术发展的需求,这种力量将远超过Arm一家公司。

“我们相信通过世界范围的协同创新,在各国各行各业的共同努力下,RISC-V可以引领世界RISC架构的潮流,也就是CPU架构的潮流。”倪光南同时表示,相比主流的X86和ARM,RISC-V最大短板是在生态方面,中国新型举国体制、超大规模市场优势和人才优势,可以在发展和完善RISC-V生态方面起重大作用。

他呼吁,促进RISC-V生态繁荣,推动构建世界主流CPU领域新格局。 

x86、Arm、RISC-V三分天下,中国要抓住DSA服务器机遇

倪光南预测,在CPU芯片领域,未来将形成英特尔(x86)、Arm、RISC-V三分天下的格局。其中新一轮AIoT生态将以“RV++”表征(1套ISA + 1套基础软件+N种定制化芯片)来适应丰富的场景。在AI、IoT、智能网联车等等新兴市场,RISC-V生态可以与x86和ARM进行比较公平的竞争,在被x86垄断的服务器市场,RISC-V可以依托DSA(Domain Specific Architectures)新型服务器取得一定的竞争优势。

此外,近几年中国服务器市场上非x86 服务器的份额仅在10%左右,市场被x86服务器所垄断,性价比、能耗比等难以提升。基于RISC-V架构的新型服务器将替代传统的x86服务器,“融合RISC-V、扩展指令集、Chiplet(小芯片组)等技术,发展新型服务器是中国的一个机遇。” 倪光南表示,“中国是世界最大的数据大国,对服务器有重大需求。”

随着AGI(通用人工智能)的发展,中国AI算力中心建设正在蓬勃兴起,基于RISC-V架构的DSA新型服务器有可能实现对传统x86服务器的替代。

近年来伴随着RISC-V的兴起,DSA这种创新的处理器架构引起了人们的关注。DSA 即特定领域架构、专属领域架构…也有人把DSA作为加速器,这里指的DSA是一种更一般化的架构,它面向特定领域,通过定制的架构以更好地适应需求,例如用于机器学习的神经网络处理器,用于图形学、VR等的GPU,可编程网关和接口。

倪光南表示,DSA需融合硬件和软件技术,包括更有效的并行算法,更有效的存储带宽利用,削减不必要的计算精度,采用面向领域的编程语言DSL等等。DSA还可能与面向领域的语言DSL相结合,如OpenGL、TensorFlow等。

发展DSA,需要新的技术队伍。他们了解并掌握垂直集成的一系列技术,包括特定领域的应用,适合该领域的DSL和相关的编译技术,架构原理,实现技术等等。

如何有效实现DSA?

RISC-V自定义扩展指令,是实现DSA的有效途径之一。

DSA可以用ASIC实现,但缺乏灵活性,成本高。RISC-V为易于扩展而预留很大的操作码空间,它除了提供许多标准扩展指令集外,还容许用户按需自定义扩展指令。如此一来RISC-V就能成为实现DSA的理想平台,用户可以根据领域的特定需求推出定制化芯片。

一个时期以来,随着软件技术和工具的发展,软件定制化或“软件定义”已经被人们所普遍接受。今后,随着RISC-V扩展指令集功能作用的充分发挥,芯片定制化或“芯片定义”也会被人们所普遍接受,DSA将成为一种流行的架构。

迄今为止,DSA还是一个新事物。目前人们往往将它与GPU、神经网络处理器、AI专用处理器等等这类大型应用联系在一起。“但实际上,由于RISC-V自定义扩展指令集既可以是一个大集合,也可以是一个小集合,由此构成的DSA定制芯片既可以针对大的应用,也可以针对小的应用。”倪光南指出,今后RISC-V自定义扩展指令将无处不在,由此构成的DSA芯片也将无处不在,最终将会进入一个定制化芯片或定制化硬件的时代。

新事物的诞生往往伴随着一个较长的学习过程,但面对瞬息万变的市场,时间就是生命。工程师们需要一个快速上手的教程,可以3月28日来上海张江科学会堂,参加“EDA与IC设计论坛”,这里有一场用C语言设计DSA的演讲,相信会让你有所收获。详细议程见下图,欢迎点击报名参会

另一条有效途径是Chiplet

Chiplet又称“小芯片”或“芯粒”,它是将一个功能丰富且面积较大的芯片裸片(die)拆分成多个芯粒(chiplet),并将这些具有特定功能的芯粒通过先进封装的形式组合在一起,最终形成一个系统芯片。

我们常见的系统级芯片SoC(System on a Chip)是将不同功能元器件整合在单个芯片上,开发时间长、良率低且各功能模块的工艺必须相同,都得用SoC上要求最高模块的工艺,成本较高。例如芯片中的CPU、GPU采用7nm,那么其他的接口、传感等部分也必须采用7nm。

另一种类似的系统级封装SiP(System in a Package)则是将多芯片异构集成,开发时间较短、良率较高,部分可重复使用。但一个系统中,芯片往往只占系统中器件数目的10%左右。如果把其他所有器件都集成在单一芯片上,可能会导致性能不佳,成本增加。

Chiplet对需要实现的复杂功能进行分解,然后开发出多种具有单一特定功能的裸芯片,这些来自不同功能、不同工艺节点的裸芯片可相互进行模块化组装,最终形成一个完整的芯片。

仅对核心 Chip 采用先进工艺,其他部分采用成熟工艺的异构集成,有效降低对先进工艺的依赖,为芯片设计带来了更大的灵活性和可扩展性,有效提升了产品的功能性和良率。同时良率、成本、异构计算上的优势,让Chiplet更适合复杂功能的定制化需求。

近来通用 Chiplet互联标准(UCle)发布,以及中国企业和专家主导制订的Chiplet技术标准《小芯片接口总线技术要求》(T/CESA 1248-2023)的发布,更促进了Chiplet的发展,它对我国半导体产业的发展,包括实施DSA架构都有很大的意义。

如何做好Chiplet设计?3月28日,在上海张江科学会堂海科厅将举办一场“Chiplet与先进封装技术研讨会”,来自国内外一流厂商的技术专家将就您关心的一系列问题进行解答。议程见下图,欢迎点击报名参会

总结

综上所述,倪光南认为,融合RISC-V、扩展指令集、DSA、Chiplet及其互联等技术,发展RV-DSA服务器是中国的一个机遇。

“芯片技术是信息技术领域的关键核心技术,聚焦RISC-V发展中国芯片产业有助新动能,发展新质于在新时期下,贯彻实施以科技创新催生新产业、新模式、生产力的方针。”倪光南总结道,“我们应发挥超大规模市场优势和人才优势,大力支持开源创新积极参与全球科技创新网络和科技治理,与世界协同,促进RISC-V生态繁荣,为在世界主流CPU领域形成x86、ARM和RISC-V三足鼎立的新格局,贡献智慧、方案和力量。”

责编:Luffy
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
量子计算利用了三种关键量子原理:叠加、纠缠和干涉。这些概念在量子计算机中发挥着根本作用,从而使得量子计算机与传统计算机有很大不同。
尽管有着积极的预测,人工智能半导体领域仍面临持续的挑战,特别是在性能和功效方面。因此需要进一步努力加强和完善设计,使基于人工智能的工作负载能够低功耗执行。
为了克服CPU和GPU的限制,为人工智能推理工作负载专门设计的创新型硬件加速器,可实现高效和优化的处理,同时最大限度地减少能耗。
生成式人工智能应用的爆炸式增长,刺激了对人工智能服务器和处理器的需求飙升。目前,这些处理器中的大多采用计算式GPU,如英伟达的GPU。但随着DSP算法的快速发展,DSP是否也能满足AI处理器应用?这些高性能算法是否能够助力DSP取代GPU呢?针对这些问题,且看本文作者的观点分析。
GPU在游戏、专业视觉之类的图形应用之外,还广泛用在通用计算加速、数据中心领域。不过如果追本溯源去看GPU的“初心”,用于图形渲染的GPU又发展到哪儿了呢?它和通用计算乃至AI计算的GPU市场比起来如何?
新的管制条例的更新主要体现在新增和修改两大方面。整体来看,新管制条例的修改也可总结为:美国将进一步收紧对中国获取半导体技术的限制,同时还不放弃中国的半导体市场。
此次GTC上新推出的用于AI/ML计算或者大模型的B200芯片有一个显著的特点,它与传统的图形渲染GPU大相径庭并与上一代用于AI/ML计算的GPU很不一样。
在现代制造业中,仅依靠制造执行系统(MES)、设备自动化系统(EAP)、高级计划排程系统(APS)、实时派工系统(RTD)等各种管理系统,还远远不够。工程智能(Engineering Intelligence, EI)作为半导体工业软件体系的核心环节,正扮演着越来越重要的角色……
凌华科技EGX-PCIE-A380E 集成了Intel Arc GPU,是一款性能强大且高效的PCIe Gen4独立显卡
支持软件开发团队在虚拟硬件平台上进行固件和MCAL开发
文|萝辑怎么简单直白地评价智己L6呢?蹭个热点吧,就是小米SU7的核心优点它都有,而SU7所有让人难受、别扭的地方,它都解决了。虽然车圈的价格战已经打了好几轮,但是小米SU7的上市,还是可以看成一个重
插播:6月14日,行家说碳化硅大会即将在上海举办,报名请点击文末“阅读原文”。上周,“行家说三代半”剖析了小米汽车的SiC芯片用量和技术路线(点击查看),最近,比亚迪、上汽、北汽、奇瑞、吉利5家车企的
点击上方蓝字谈思实验室获取更多汽车网络安全资讯 线下交流  专业社群  精品活动推荐 更多文章不要错过哦,这可能是汽车网络安全产业最大的专属社区!关于涉嫌仿冒AutoSec会议品牌的律师声明一文带你了
4月8日晚间,士兰微发布2023年年度报告,其中发光二极管板块营收同比增长,LED 芯片销售额较去年同期有一定幅度的增长;部分业绩信息如下:◆ 营收:93.40亿元,同比↑12.77%;◆ 净利润:亏
插播:6月14日,汽车碳化硅大会即将在上海举办,报名请扫上方二维码前段时间,上海、浙江、湖北等地5个IGBT/SiC项目曝新进展(.回顾点这里.);近日,安徽、湖北以及山东也传来IGBT项目新动态,详
近日,海能达在其官网发布公告称“根据美国法院的法令,在另行通知之前,海能达不得在世界任何地方销售任何含有对讲机技术的产品”。从美国法院法令文件来看,这是一份藐视法庭制裁令。4月8日,海能达发布“关于重
OpenAI全面开放ChatGPT,将进一步刺激高效运算需求成长,引爆数据中心需求激增。大宗商品贸易商托克(Trafigura)表示,到2030年,与人工智能(AI)和数据中心相关的铜需求可能会达到1
智能驾驶芯片的市场竞争正在持续升级。4月9日,面向中央计算时代,AMD重磅推出了第二代Versal自适应SoC。据了解,该芯片采用7nm工艺制程,内置高达200.3k DMIPS算力的Arm Cort
根据TrendForce集邦咨询旗下新能源研究中心2024年4月3日的报价,单晶复投料人民币价格为 RMB54/KG;单晶致密料人民币最新价格掉落至 RMB52/KG,跌幅为 7.14%。N型料人民币