广告

详解ARM Neoverse V1和N2新平台技术细节,各有什么性能绝招

时间:2021-04-28 22:42:49 阅读:
上个月底是Arm 10年来第一次更新设计架构-发布最新一代架构Armv9,本周公布了两个新平台,并发布了更多关于Neoverse N2和Neoverse V1的技术细节,以及Project Cassini 、Mesh互联技术Neoverse CMN-700。同时,Arm介绍了更多生态建设方面的进展,包括与腾讯、阿里云、甲骨文等公司合作的进展。
广告

上个月底是Arm 10年来第一次更新设计架构-发布最新一代架构Armv9,本周公布了两个新平台,并发布了更多关于Neoverse N2和Neoverse V1的技术细节,以及Project Cassini 、Mesh互联技术Neoverse CMN-700。同时,Arm介绍了更多生态建设方面的进展,包括与腾讯、阿里云、甲骨文等公司合作的进展。

Arm Neoverse V1全新计算平台发布

Arm今天还发布了全新的计算平台“Arm Neoverse V1”。

这是Arm设计的第一个支持SVE(可伸缩矢量扩展)的内核,可为高性能计算、机器学习带来大幅度的性能提升。

Arm N系列是注重平衡性、高能效的平台,Arm V系列则是追求极致性能,具备更大的缓冲、缓存、窗口、队列设计,拥有更大的带宽、面积、功耗。

基于性能至上的理念,V1平台创造了Arm迄今为止最宽的微架构,可容纳更多运行指令,支持高性能和百万兆级计算,再加上SVE功能,V1在单核性能上优势十分明显,全方位碾压N2平台。

而在强化单核性能的同时,V1平台也支持强大的多核心扩展,最多可以做到96核心96线程,工艺上可以使用7nm、5nm,还支持DDR5内存、PCIe 5.0总线、HBM2e高带宽内存、CCIX 1.1互连标准等。

Arm V1平台仍然基于Armv8.4-A CPU指令集,不过整体架构、模块组成和基于Armv9指令集的非常类似,有诸多相通之处,同时也有全方位的微架构改进,针对基准测试、服务器/高性能计算工作负载的全面增强,当然也不会不计代价地拉高功耗,同样在电源、功耗、发热管理方面做了强化。

相比于N1,作为Arm强调性能优先的新型计算系列的第一个平台,V1带来了50%的性能提升、1.8倍的矢量工作负载优化、4倍的机器学习工作负载优化,可以灵活地为高度依赖CPU性能、带宽的应用构建强大的计算能力,SoC设计也非常灵活。

生态方面,法国芯片公司SiPearl、韩国电子通信研究所(ETRI),都在打造基于V1平台的高性能SoC。

印度电子信息技术部(MeitY)夜间采纳V1平台,打造国家级百万兆级高性能计算项目。

另外,Arm今天同步发布了Arm Neoverse CMN-700,这是业界最先进的Mesh网格互连技术,能充分发挥V1、N2平台的性能、能效优势。

在上一代CMN-600的基础上,CMN-700在每个矢量上都进一步提升了性能,包括核心数量、缓存大小、附加内存及IO设备的数量和类型等等。

 

ARM Neoverse N2平台发布

今天,Arm又发布了第一个基于Armv9指令集架构的平台“Arm Neoverse N2”,在安全性、能耗、性能等方面都有全面的提升,可为新一代基础设施核心铺平道路。

Neoverse N系列平台最为注重性能的扩展性、平衡性,特别针对单位功耗、单位面积的性能,以及单位功耗、面积的核心数。

相比主要搭档7nm工艺的上代平台N1,新一代N2最佳搭档是5nm,两相对比在保持相同水平的功率、面积效率的基础上,N2的IPC同频性能(约等于单线程性能)可提升达40%,而频率也可以提高10%。

N2平台可以横跨从高吞吐量计算到功率与尺寸受限的边缘、5G应用场景,且性能提升明显,例如在云端上提升1.3倍的NGINX,在5G和边缘应用上提升1.2倍的DPDK数据包处理,以及提升1.4倍的SPECint2006。

N2平台内部集成了Armv9.0-A CPU核心、指令集单元、64KB一级指令缓存、64KB一级数据缓存、512KB/1MB ECC二级缓存、异步桥接(Async Bridges)、AMBA 5 CHI直接连接、CoreSight等模块,微架构全方位改进,重点增强基准测试、实际服务器工作负载。、

而在外部系统连接中,它可以支持DDR5内存、PCIe 5.0总线、HBM3高带宽内存,等等。

N2还是第一个具备SVE2功能的平台,可为云到边缘的性能效率带来巨大的提升,比如机器学习、数字信号处理、多媒体、5G等场景中,还具备编程简易性、可移植性等优势。

SMT同步多线程是如今处理器架构设计的一个核心要素,不过另一方面,在云端等共享环境中,专属内核可以提供更具可预测性、确定性的性能,而且更有利于抵御常见的侧信道攻击,这也是N2的理念。

同时,它维持了相同的功耗、面积效率,加入了性能定义功耗管理(PDP)。

N2平台起步就是32核心32线程,最多可以做到128核心128线程,对比N1平台翻了一番,同时比传统架构的64核心128线程更具竞争力。

生态方面,Marvell美满电子已经发布了基于Neoverse N2平台的OCTEON系列网络解决方案,预计2021年底前试产,相比上代性能提升高达3倍。

阿里云在即将上线的Arm架构ECS实例上已经完成测试,SPECjbb测试数据表现惊艳,而且基于Arm架构运行的DragonWell JDK性能提高了 50%。

腾讯也在硬件测试和软件支持方面持续投入,云应用上已经可以采用Arm Neoverse技术。

 

责编:editorAlice

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了