广告

Armv9细节公布,Arm迎来十年最大架构革新

时间:2021-04-09 作者:邵乐峰 阅读:
在Armv8架构发布后的第十个年头,Arm于日前宣布推出Armv9架构,以满足全球对功能日益强大的安全、人工智能(AI)和无处不在的专用处理的需求。按照Arm首席执行官Simon Segars的说法,Armv9将成为未来十年内驱动下一个3,000亿Arm架构芯片发展的技术先驱。
广告

如果问Armv9与Armv8究竟有何不同?那么安全性、AI以及改进的矢量和DSP功能,应该会是该架构最重要的“三大支柱”,尤其是安全性。

过去几年中,保护全球数据安全已成为芯片行业的头等大事,为此,Armv9架构中引入了Arm机密计算架构(Confidential Compute Architecture, CCA)。机密计算通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。

Arm CCA将引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,以实现保护数据安全的目的。例如,在商业应用中,机密领域可以保护系统中商用机密数据和代码,无论它们正被使用、闲置或正在传输中。

内存标签扩展(memory tagging extensions, MTE)功能也值得关注,尽管这并不是v9的新功能,而是随着v8.5引入的,但它旨在通过在分配时标记指针并在使用时进行检查,来帮助解决软件世界中两个长期存在的安全问题:缓存溢出(Buffers overflows)和释放后重用(use-after-free)。通过提升软件安全性并消除软件中存在的问题,可以提高软件在用户层面的安全信任度,如此一来,用户将更愿意通过计算机来处理事情,从而将增加对Arm架构的芯片使用。 

再来看一下Armv9对AI功能的支持与扩展。

AI工作负载的普遍性和广泛性需要更多样化和专用的解决方案。据估计,到21世纪20年代中期,全球将有超过80亿台搭载AI语音辅助的设备,且90% 或更多设备上的应用程序将包含AI元素以及基于AI的界面,如视觉或语音 。 

为了满足这一需求,2016年,Arm与富士通合作开发了可伸缩矢量扩展(Scalable Vector Extension, SVE)技术,并首次在富士通A64FX CPU内核中实现,该芯片驱动了世界上最快的超级计算机“富岳”。在此基础上,Arm为Armv9开发了SVE2,以便在更广泛的应用中实现增强的机器学习和数字信号处理能力。 

与SVE相比,SVE2增强了对在CPU上本地运行的5G系统、虚拟和增强现实以及ML工作负载的处理能力,例如Scatter-Gather DMA直接存储器访问,将该功能放到CPU架构中能实现更多的循环,更大的DSP处理能力,从而支持更多的并行化。在未来几年,Arm将进一步扩展其技术的AI能力,除了在其Mali GPU和Ethos NPU中持续进行AI创新外,还将大幅增强CPU内的矩阵乘法指令(Matrix multiplication instructions)。

因为Arm认为在未来几年中,越来越多的ML工作负载,甚至是在专用加速器上运行ML工作负载,将在对性能或电源效率有关键要求的场景中变得司空见惯,而矩阵乘法指令将成为Arm生态系统更大范围采用v9 CPU所迈出的重要一步。

在过去的五年里,Arm每年都以超过业界的速度在提升CPU性能,Armv9也不例外,预计未来两代移动和基础设施CPU的性能提升都将超过30%。Arm高级副总裁、首席架构师兼技术院士Richard Grisenthwaite表示,这个数据是根据业界标准评测工具来衡量的,而且这样的算力提升完全是凭借于架构本身而非制程工艺来实现。另外,随着摩尔定律正在放缓,Arm未来将通过最大化地提升频率、带宽、缓存大小、并减少内存延迟,以最大化CPU 性能。

但其实,随着行业从通用计算向普遍的专用处理发展,每年两位数的CPU性能提升是不够的。除了增强专用处理能力,Arm的全面计算(Total Compute)设计方法将通过集中的系统级硬件和软件优化以及用例性能的提高,加速总体计算性能。

通过将全面计算的设计原则应用在包含汽车、客户端、基础设施和物联网解决方案的整个IP组合中,Armv9系统级技术将遍及整个IP解决方案,并改善个别IP。此外,Arm还在开发多项技术以提高频率、带宽、缓存,并降低内存延迟,从而最大限度地提升基于Armv9的CPU性能。

在Armv9推出之后,率先推出的将是针对安全、DSP、ML这三个重点领域的Armv9-A系列,相关产品最快在2021年年底就会面世。之后,Arm还会逐渐推出Armv9-M与Armv9-R系列。

Richard Grisenthwaite称,事实上,此前Armv8不仅被广泛地应用于智能手机中,在其他领域,比如服务器、PC、网络设备中也都能看到Armv8的身影。同样,Armv9也将会应用于上述所有领域,尤其是在服务器和汽车市场。他坦承,为了解决一些新的问题,Arm确实加入了一些看起来更加复杂的技术,但Arm架构的精简指令(RISC)核心没有改变,依然遵循着注册到注册(registration to registration)的操作原则,所以从硬件角度来看,Arm指令集仍然保持着精益性。同时,考虑到兼容性对于Arm十分重要,所以Arm确保了在32位/64位v8架构中的所有功能均将在v9架构中得到支持。

最后,在被问及Armv9架构今后是否可以供给包括华为在内的中国企业时?Arm市场营销副总裁Ian Smythe承诺说,“Arm既有源于美国的IP,也有非源于美国的IP。经过全面的审查,Arm确定其Armv9架构不受美国出口管理条例(EAR)的约束。Arm已将此通知美国政府相关部门,我们将继续遵守美国商务部针对华为及其附属公司海思的指导方针。”

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
邵乐峰
ASPENCORE 中国区首席分析师。
  • 大股东南京晶芯申请下,德科码半导体将重整 全国企业破产重整案件信息网发布南京市中级人民法院关于德科码(南京)半导体(以下简称:德科码)重整情况的公告。公告显示,2021年4月29日,本院根据南京晶芯集成电路产业投资中心(有限合伙)的申请裁定德科码公司重整……
  • 国科微回应“妖股”事件:与华为没有业务往来,和Chia币挖 近段时间芯片股普遍表现不佳,但五一节前后,国科微犹如“妖股”一路飙升,一个月以来最高涨幅接近140%。对此国科微披露澄清公告称,传闻所提到公司与华为海思存在芯片合作事宜为虚假信息,公司与华为及海思没有合作或业务往来。Chia币挖矿也不采用固态硬盘芯片,公司芯片销量的增长主要来自于国产替代……
  • 800万单一来源采购! 芯翼信息科技获中国移动NB-IoT芯 中移物联网有限公司采购与招标网公开启动了NB-IoT芯片采购项目结果,该项目共集采800万片NB-IoT芯片,采用单一来源集采方式。芯翼信息科技NB-IoT芯片XY1100系列获得了单一来源采购,值得一提的是,该项目的单一供应商芯翼信息科技在去年6月份也拿到了中移物联网有限公司NB-IoT芯片采购项目的200万片订单。
  • 芯华章完成超4亿元Pre-B轮融资,EDA 2.0第一阶段研究成 芯华章(X-EPIC)日前宣布,公司已完成超过4亿元Pre-B轮融资,由云锋基金领投,经纬中国和普罗资本(旗下国开装备基金)参投。在本轮融资中,芯华章既有股东红杉宽带数字产业基金、高瓴创投、高榕资本、大数长青持续支持,皆在本轮坚定跟投。同时芯华章还表示,已完成对EDA 2.0的第一阶段研究,即将公布成果……
  • 苹果英特尔等巨头组建“美国半导体联盟”,施压美国政府 日前,全球最大的芯片买家们——包括苹果、微软、谷歌、亚马逊等科技巨头,与英特尔、台积电等芯片制造商,联合组建了一个新的游说团体向美国政府施压以期获得芯片制造补贴。该新团体名叫美国半导体联盟(SIAC,Semiconductors in America Coalition)……
  • 从验证到数字EDA全流程,国微思尔芯的坚持与向往 自芯片“国产替代”成为热门话题,集成电路行业自上至下愈发强调自主可控,其中的EDA作为芯片设计的上游与产业的重要基础,自然成为国家、资本和业界关注的重点。全球最为知名、占据市场大头的三家EDA企业都在美国。不断拉长的实体清单亦为国内集成电路产业全方位自主可控能力敲响了警钟:EDA已经是中国集成电路行业发展的阿喀琉斯之踵。
  • Intel 11代酷睿1处理器正式发布:10 今晚,Intel发布的11带酷睿处理器采用10nm制程,面向高性能移动桌面版。同时发布的还有同样架构的至强W-11000系列,面向高性能移动工作站。
  • AMD RX 6600系列或配备8GB显存 MD的RX 6600系列可能配备的不是之前传闻的6或12GB显存,二是8GB。可能包含64MB的内置Infinity Cache。
  • Silicon Labs全新Matter解决方案简 物联网行业的成功取决于简便性、可靠性和安全性,Matter无线解决方案使开发人员可以专注于创新并将产品推向市场,以实现无缝的消费者体验。
  • 新思科技为中兴通讯提供BSIMM软件 安全对于任何构建和使用软件的企业和个人来说都至关重要, 中兴通讯采取积极主动的安全举措,包括采用新思科技(Synopsys)的Coverity 静态应用安全测试、Defensics 模糊测试、Black Duck 软件组成分析以及软件安全构建成熟度模型(BSIMM)评估等。
  • 中国电信5G承载STN集采:华为、中兴、烽火和新华三中标 5月12日,中国电信公示《2021年STN设备建设工程集中采购项目》STN-B标包中标候选人。根据评审结果,中标候选人推荐如下:1.第一中标候选人(1)单位名称:华为技术有限公司和华为技术服务有限公司
  • Cleveron推出新型最后一英里送货机器人 该公司计划于2023年开始批量生产该车辆。文|网络全球领先的包裹运送机器人公司之一的Cleveron近日发布了其新型无人驾驶半自动最后一英里送货机器人Cleveron701。作为欧洲第一家获得在全国公
  • “史上最好安卓手机”即将登陆德国市场:售价近万元 3月29日,小米接连举办了两场春季新品发布会,正式推出了备受关注小米11 Ultra等多款产品,其中小米11 Ultra首发与三星联合研发的业界1/1.12英寸最大底传感器GN2,并首次采用了“三主摄
  • 外资AGV企业为什么玩不转中国市场? 一方面是中国移动机器人企业近几年获得了长足的发展,另一方面也与外企在中国的战略布局有关。文|大峻随着AGV行业的不断发展,企业间的交流与合作也越来越多,无论是国外企业的“走进来”还是中国企业的“走出去
  • 产业丨腾讯AI芯片流片,云厂商全部进入造芯行列 ·聚焦:人工智能、芯片等行业欢迎各位客官关注、转发前言:随着腾讯的布局,目前几乎全球所有的云厂商都进入了造芯的行列,而且都在优先考虑定制设计。作者 | 方文图片来源 | 
  • 博众精工科创板上市:市值84亿 博众精工主要从事自动化设备、自动化柔性生产线、自动化关键零部件以及工装夹(治)具等产品的研发、设计、生产、销售及技术服务。文|新战略2021年5月12日,博众精工科技股份有限公司正式在上交所科创板上市
  • 拒绝亮机卡:AMD这次太良心了! AMD RDNA2家族已经诞生了两个核心,包括RX 6900、RX 6800系列的Navi 21、RX 6700系列的Navi 22。据说,接下来的RX 6600系列将会使用Navi 23小核心。那么
  • 嵌入式方案设计文档该怎么写? 俗话说,不会写文档的工程师不是好的工程师!如果你只会写代码,而从不写文档,迟早有一天会“出事”。这不是危言耸听,现实生活中有很多活生生的例子。1不写文档有什么后果?如果不写文档,开发过程中就会出现类似
  • 图文解说S参数(基础篇) 1、简介:从时域与频域评估传输线特性简介:从时域与频域评估传输线特性良好的传输线,讯号从一个点传送到另一点的失真(扭曲),必须在一个可接受的程度内。而如何去衡量传输线互连对讯号的影响,可分别从时域与频
  • 比亚迪、斯达、中车时代领跑!IGBT迎来新能源汽车爆发机遇 国家政策鼓励车规级半导体发展,IGBT已成为新能源汽车核心部件国内IGBT产业呈现比亚迪、斯达、中车时代三强领跑,多家直追的趋势汽车半导体技术与市场论坛2021将于6月24-25长沙举办,中车时代电气
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了