广告

比苹果M1更牛的芯片,明年高通可能要造出来了

时间:2021-04-29 作者:黄烨锋 阅读:
苹果M1证明了Arm也能用来造高性能处理器,但并不意味着其他同在Arm阵营的企业有这种能力。和苹果存在直接竞争关系,且同在Arm阵营的,市场表现比较出色的应该就是高通了:无论是在手机处理器,还是在PC处理器上。
广告

苹果M1作为Arm之光,似乎已经成为很多芯片厂商的噩梦了。它不光是Intel、AMD的噩梦,也是高通、联发科这类厂商的噩梦,因为它刷新了芯片的单核性能与IPC,整体还能保持很低的功耗。蒂姆库克最近还偷偷潜入苹果总部,偷偷把M1从MacBook身上搬到了iPad与iMac内部。

有关M1的彪悍能力,我们在此前的文章里已经多有介绍。简单回顾一下苹果自己宣传中的数据:

这张宣传图横轴代表CPU功耗,纵轴代表CPU性能。其嚣张之处在于,一方面它没有明确标尺和对比对象(常规传统),另一方面则从图中可见,在相同功耗下(如10W),其性能领先幅度远高于竞品——苹果当前的宣传数字是,同功耗下最高2倍性能领先。与此同时,仅需“25%的功耗”就达到传统PC所能达到的峰值性能。(记忆中,苹果可能修改过表达)

虽然所谓的“竞品”指代不明,但大抵上也就是指Intel的十代或十一代酷睿处理器了。这张含糊不清的图,其嚣张程度几乎已经到了无视摩尔定律和行业常规的程度,“在座的都是XX”——当然我们知道,具体数值并没有苹果宣传中那么理想,毕竟x86这边的处理器仍有频率方面的显著“优势”。

如此前探讨性能详情时所述,这张图不仅吊打了Intel(Ice Lake/Tiger Lake)、AMD(Zen 2/Zen 3),也吊打了高通(骁龙8cx一代二代)、三星(Mongoose)等Arm同阵营的其他市场参与者。似乎在未来很长一段时间内,都很难再出现这么嚣张的能效吊打数据了。直到有家叫Nuvia的公司制作了另一张吊打苹果的图。

高通的处理器有多高性能?

苹果M1证明了Arm也能用来造高性能处理器,但并不意味着其他同在Arm阵营的企业有这种能力。和苹果存在直接竞争关系,且同在Arm阵营的,市场表现比较出色的应该就是高通了:无论是在手机处理器,还是在PC处理器上。

单纯从CPU核心的角度来看,高通目前的高性能核心实际上也就是ArmCortex-X1了,具体的芯片产品即骁龙888——X1也代表了Arm自己目前的高性能核心微架构。有关Cortex-X1的详情,我们在此前分析5nm芯片文章中已经提到过。

Cortex-X1实则表现出Arm有进一步向高性能领域,包括PC、数据中心等市场进发的意思(面向服务器的Arm Neoverse V1高性能核心,正是Cortex-X1的改进版)。因为传统的Arm微架构普遍在低功耗方面做文章,比如Cortex-A系列IP是追求PPA性能、功耗和成本三方均衡的。而Cortex-X1突破了这种传统,首次在PPA三角中向性能偏移,并一定程度牺牲功耗和成本。

微架构层面,Cortex-X1在宽度上明显加宽,虽然还没到苹果M1的Firestorm核心的程度,但比同代Cortex-A系列已经是规模上的扩展了,比如5-wide decoder前端,ROB条目增加40%,NEON宽度加倍,L2和L3 cache容量加倍,Mop cache条目加倍。很多指标甚至比Intel的Sunny Cove(十代酷睿)还要彪悍。Cortex-X1实现了相较Cortex-A77大约30%的IPC提升。

30%的IPC提升仍然是相当出色的迭代数字。不过对PPA平衡的打破,也一定程度表明至少从核心层面来看,CPU的单核性能提升即便在Arm这边,也变得越来越有难度。

Cortex-X1的具体实施,主要包括了高通骁龙888和三星Exynos 2100。上面这张图包含了AnandTech针对这两颗处理器的SPEC2006性能测试数据,左边的柱状条代表跑完整个测试的能耗(越短越好,单位焦耳;其中柱状条右边的第一个数字表示平均功耗-单位瓦特-即单位时间内做的功),右边的柱状条代表性能成绩(越长越好)。

无论是整数还是浮点测试,Cortex-X1的IPC提升基本符合Arm预期(虽然三星和高通都没有用上Arm为X1设计的顶配,比如仅一半容量的L3 cache),但骁龙888(以及Exynos 2100)还是被苹果A14(与M1一样的Firestorm核心)甩开一截的,从能耗与性能的角度来看都是如此。可见文首的苹果“吊打图”,实实在在地表现了苹果自身在高性能CPU核心设计方面的能力。

至于另一个方向,高通面向笔记本的骁龙8cx,此前我们也探讨过。这颗处理器在CPU核心层面还在用Cortex-A76(高通定制版的Kryo 495),从系统层面加倍内存带宽、提升芯片TDP,来提高其性能。但从已上市的笔记本产品来看,苹果M1可以在性能层面把骁龙8cx按在地上摩擦,无论多核还是单核性能,前者都是后者的2.2-2.5倍。应用骁龙8cx的Surface Pro X,轻度办公是够了,但在更追求性能的生产力应用中,骁龙8cx还是比较悲惨的。

虽然以上内容更多探讨了手机、笔记本这样的移动领域,但核心本身很多时候是在不同应用领域共享的,只不过会有频率、cache、规模方面的弹性扩展。高通现阶段是很难拿出在性能上和苹果抗衡的处理器的。单纯从性能的角度来看,如上周我们探讨Arm服务器处理器的文章,即便有新推的Arm Neoverse,其单线程、每核心性能也依然达不到x86处理器的水平(虽然数据中心的很多应用可能并没有那么看重单核性能,而且Neoverse有功耗方面的优势)。

所以高通收购了Nuvia

高通在骁龙820之前一直有自研微架构的传统,像如今的苹果一样,即基于Arm指令集做自有微架构的尝试。不过这个动作从骁龙835开始便停止了,自2017年之后,高通在骁龙处理器的CPU之上,就采用Arm“公版”核心IP、放弃自研微架构了。

这与当时的多种因素相关,可能包括早期Kryo架构(骁龙820/821)在路线上走偏(过于注重浮点性能,以及功耗崩边致最终产品规格被砍等问题),Arm后期针对核心IP授权模式越来越灵活(表现在可半定制,或更多可选配置),Arm自己的技术在日趋成熟,以及高通当时在自身发展上也遇到了一些问题。

自研微架构之路没那么好走,三星Exynos处理器从自研架构的入门到入土(2016-2020)都没有一款真正可拿得出手的作品,就是前车之鉴。这也更能衬托苹果芯片的彪悍。

所以高通选择了收购一家初创公司Nuvia,收购价格14亿美元,收购完成是在今年3月份。从宣布收购到收购完成,也就几周时间。高通收购Nuvia实在是顺理成章的事情,这家公司除了设计基于Arm的核心产品,其人才储备是令人相当眼馋的。

这家公司成立于2019年,创始人包括苹果CPU团队的前任首席架构师 Gerard Williams;联合创始人John Bruno,此前也在苹果和谷歌做过系统架构师。这俩人都有数十年的处理器设计经验,另外加入这家公司的大神还有Manu Gulati,也是前谷歌与苹果芯片团队核心成员。

其中Gerard Williams不仅在Arm公司工作了12年,而且还曾领衔过苹果A系列芯片Cyclone(苹果A7处理器CPU核心,iPhone 5s)、Typhoon(A8,iPhone 6)、Twister(A9,iPhone 6s)、Hurricane(A10的大核心,iPhone 7)、Monsoon(A11大核心,iPhone 8/X)以及Vortex(A12大核心,iPhone Xs)架构的设计。2019年12月,苹果状告Gerard Williams,称其违反合约,包括擅自创办企业,以及挖角旗下员工——这种八卦还是能够说明Williams的地位的。

有关Nuvia公司旗下产品,我们很难挖到什么细节。为数不多的线索就是Nuvia发布的几篇博客文章——且估计后续看不到Nuvia的博客更新了。从Nuvia最后一篇更新的博客文章可见,下一篇原本是打算谈更多芯片功耗管理方面的技术的,可能会提及Nuvia相关的技术;被高通收购后,就要看高通在相关技术公开方面的策略了。

Nuvia实际的芯片产品尚未问世,而在上个月的高通发布会上,高通提到“首个搭载高通全新内部设计CPU的高通骁龙平台,预计将在2022年下半年出样,设计上针对高性能超级本产品。”换句话说,Nuvia为高通贡献的Arm自研架构处理器最早可能会在2022年问世。

不过Nuvia这家公司原本着力的方向是数据中心的服务器处理器。如文首所述,去年8月份这家公司画了一张比苹果M1更嚣张的图,如下:

这张图横轴同样代表功耗,纵轴代表单核性能(Geekbench 5测试性能)——大致上与文首苹果呈现那张图的维度是类似的。这张图中,紫色、蓝色、绿色那几条比较平缓的曲线,是Intel和AMD近代的处理器产品,包括Intel十代酷睿的Sunny Cove核心,AMD Zen 2核心等。

而红色、黑色、灰色那三条曲线分别代表高通骁龙865(Arm Cortex-A77)、苹果A12X(Vortex)、苹果A13(Lightning)。最左侧那条深蓝色辐射状“曲线”就是Nuvia的Phoenix核心了(据说画成这个形状,是为了将来再揭晓具体数值)。不管这个表达方式有多奇特,在Nuvia标定的深蓝色区间内,吊打苹果前几代芯片产品的CPU性能和功耗是没问题的。

虽然这其中没有加入苹果M1/A14(Firestorm),也没有加入最新的AMD Zen 3和Intel Tiger Lake(十一代酷睿,事实上Intel最新的Xeon服务器处理器就是十代酷睿的Sunny Cove核心),但查一查Firestorm的Geekbench 5性能测试就不难发现,这个Phoenix才是真正的全方位吊打。苹果前员工创办的公司,果然有苹果公司的调性…

这张图的信息量也比较大,虽然Geekbench 5可能未必有那么靠谱:

第一,观察高通骁龙865(红色)与x86处理器(蓝色、绿色、紫色)可发现,x86处理器在性能上高出不少,但付出了巨大的功耗代价(x86处理器核心频率普遍很高)。在Geekbench 5测试中,x86平台以6-11倍的功耗,才达成了大约50%的性能领先。这一点算是符合预期,功耗和性能的提升关系本来就不呈线性。意即我们推测,如果考虑提高骁龙865的频率,其功耗同样大概率面临崩坏。

第二,AMD和Intel是旗鼓相当的水平,虽说AMD近两年有工艺和核心数方面的优势,但相比Intel的优势并不算大(图中未列出更新的Zen 3,在多核性能上,AMD应该会有更大的优势;另外我们认为,单纯从微架构的角度来看,Zen也并没有显得多先进)。

第三,苹果A系列芯片,在CPU性能上比高通骁龙芯片有显著优势,在CPU性能与x86平台持平或略高的前提下(注意:是单核性能),功耗有显著优势。

Nuvia认为,作为其主业,数据中心的服务器SoC芯片如今对功耗也是相当敏感的,在限定功耗的问题上与移动SoC是一致的。且服务器CPU的核心数目在增加,但TDP是需要得到限制的,则每个核心的功耗就必须得到限制。在谈Arm服务器CPU的那篇文章里,我们知道以Neoverse为代表的服务器处理器架构,目标设计一颗处理器最多可以有128个核心,未来架构更新还会涨到192个核心。

按照芯片整体TDP限定在250-300W,以及CPU外围功耗10-120W,每个核心可以分配到1-4.5W功耗。上面这张图,就是Nuvia用所谓的架构性能模型技术,规划出来的Phoenix核心性能表现。Nuvia在博客中提到,其CPU核心性能是竞品的2倍,而且还在1-4.5W这个TDP区间内。

产生这张表的测试方法,有兴趣的同学可以去看一看Nuvia的博客。我们无从了解Nuvia是如何达到这个性能和效率水平的,或者最终产品是否真的能达到宣称的水准。相关具体实现的,其博客只透露了这样几段话:

“Nuvia专注于开发一款提供行业领先性能,且最高效率的SoC。为了达成这一点,我们以一种全新的方式打造了一款服务器CPU,CPU流水线做出了全面变革。”

“虽然市场还会有更多的成长空间(指在Amazon Graviton问世以后),但市场核心对于特定TDP之下的最高单线程性能与全核性能,有着很明确的需求。对于绝大部分需求大规模集群的客户而言,这是提升性能与成本之比(Performance/TCO,TCO即总拥有成本)的最快方法。”

“我们采用了不同的方法,以没有累赘的CPU设计,提供性能和功耗的优雅平衡,最大化内存带宽和核心利用率。我们的解决方案不需要增加额外的核心来弥补单线程性能不足的缺陷。与此同时,也不需要采用市场上吹嘘的增加频率的方式——由于TDP限制,这样的频率在服务器SoC的真实应用中根本无法达到。”

值得一提的是,这项测试比较显著的一个槽点是测试工具选择了Geekbench 5。这个工具一方面并不是针对服务器处理器的,另一方面其测试项也伴随较大争议;通常认为SPEC才更具覆盖服务器使用场景的代表性,从编译到AI到天气预测应用等。不过Nuvia特别撰写了一篇文章来阐述Geekbench 5和SPEC的区别,以及说明采用Geekbench 5的合理性(这篇文章还是挺有意思)。

比如他们实测认为,Geekbench与SPEC测得的成绩是基本同步的,较少存在某款处理器一个测试分数很高,而一个则很低的情况。它们的关系接近线性,如上图所示;甚至用这种关系,得知某个测试的分数后,就能推测另一项测试的分数,准确率还挺高。

Windows笔记本是第一目标

从Nuvia几名大佬的从业经验来看,上面的这些说法有更大的概率是可靠的。高通亦极有可能借助Nuvia的收购,在未来面向不同领域的产品中再度采用自研微架构的处理器,以获得技术上的新一轮优势。

Nuvia在融入高通后,似乎暂时将不再从事服务器CPU的研究。此前高通接受采访时提到,对Nuvia的收购是为了填补这么多年来IP设计的空白,因为这些年高通一直在采用外部的IP,比如Arm的Cortex核心;而Nuvia当前最直接的目标是设计针对Windows笔记本的骁龙SoC芯片(Intel又中枪)。

另外,服务器和企业市场并非收购Nuvia的直接目标;且长期规划尚未完全敲定。高通在今年1月份发的新闻稿中提到将Nuvia的CPU技术与内部的各种加速处理器产品融合,针对不同的市场。智能手机、ADAS、增强现实、网络基础设施、笔记本等应用均在其列。预计明年到后年,Nuvia的设计抵达市场,这些领域又要热闹很久了。

责编:Amy Guan

 

  • ARM架构到桌面和移动PC是迟早的事情
本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
黄烨锋
欧阳洋葱,编辑、上海记者,专注成像、移动与半导体,热爱理论技术研究。
  • Intel 10nm工艺迭代之谜,今年的10nm是++还是+++? 前天Intel发布了11代酷睿移动标压版处理器Tiger Lake-H45,当属近两年来在AMD面前真正扬眉吐气了一把。今年的11代酷睿移动版都用上了Intel最新的10nm SuperFin制造工艺。此前,我们仔细谈过Intel 10nm工艺,本篇文章就作为其“下篇”来补完Intel 10nm工艺相关内容——即谈谈10nm SuperFin,以及尚未到来的10nm Enhanced SuperFin……
  • IBM发布首个2纳米芯片,每平方毫米容纳3.3亿个晶体管 IBM发布了业界首个2纳米芯片制造工艺,他们号称在 150mm² 的面积中(约指甲盖大小)塞入了 500 亿个晶体管,平均每平方毫米是 3.3 亿个。作为比较,台积电和三星的 7纳米工艺大约在每平方毫米 9,000 万个晶体管左右,三星的 5LPE 为 1.3 亿个晶体管,而台积电的 5纳米则是 1.7 亿个晶体管……
  • Counterpoint:2021年手机芯片市场联发科继续称霸,海思跌 Counterpoint Research在其最新分析中预测,联发科和高通等手机芯片制造商将继续主导全球智能手机AP(应用处理器)/ SoC(片上系统)芯片组市场。该公司预计,联发科将获得全球芯片市场37%的份额,但高通仍将在5G领域以30%的份额保持领先地位……
  • Arm数据中心布局前瞻:Neoverse V1/N2解读 Arm Neoverse产品线是在Cortex之外,另一条面向服务器和基础设施设备的核心IP。包括初代发布即收获不错市场反响的Neoverse N1核心IP,亚马逊Graviton2、Ampere Altra都是应用了这一IP的产品。除了N1之外,Arm此前还预告了今年即将推出的Neoverse N2和Neoverse V1,N1属于Cortex A76的变体,而今年推向市场的Neoverse V1则可类比基于Cortex X1的核心……
  • 究竟是否应该选择授权互联IP?为什么? 我们最大的问题是哪些部分需要我们内部设计,哪些部分可以从外部引入?对于是否选择第三方提供的方案,针对不同IP在这个抉择上的争议程度有所不同。在本文中,我们要采用专为互联任务设计的网络来取代SoC的内部自建总线。
  • 西门子收购形式验证软件供应商OneSpin Solutions,扩展I 自动化应用程序对于成功执行形式验证流程来说至关重要。形式验证应用程序可以自动执行常见的验证任务,并且显著简化其验证过程,为传统的形式验证技术提供了有力补充,有助于形式验证流程的普及化。收购OneSpin Solutions,将为西门子带来更强大的 IC 完整性验证解决方案和技术知识,以及广泛的自动化形式验证应用组合……
  • Intel 11代酷睿1处理器正式发布:10 今晚,Intel发布的11带酷睿处理器采用10nm制程,面向高性能移动桌面版。同时发布的还有同样架构的至强W-11000系列,面向高性能移动工作站。
  • AMD RX 6600系列或配备8GB显存 MD的RX 6600系列可能配备的不是之前传闻的6或12GB显存,二是8GB。可能包含64MB的内置Infinity Cache。
  • Silicon Labs全新Matter解决方案简 物联网行业的成功取决于简便性、可靠性和安全性,Matter无线解决方案使开发人员可以专注于创新并将产品推向市场,以实现无缝的消费者体验。
  • 新思科技为中兴通讯提供BSIMM软件 安全对于任何构建和使用软件的企业和个人来说都至关重要, 中兴通讯采取积极主动的安全举措,包括采用新思科技(Synopsys)的Coverity 静态应用安全测试、Defensics 模糊测试、Black Duck 软件组成分析以及软件安全构建成熟度模型(BSIMM)评估等。
  • 外资AGV企业为什么玩不转中国市场? 一方面是中国移动机器人企业近几年获得了长足的发展,另一方面也与外企在中国的战略布局有关。文|大峻随着AGV行业的不断发展,企业间的交流与合作也越来越多,无论是国外企业的“走进来”还是中国企业的“走出去
  • 产业丨腾讯AI芯片流片,云厂商全部进入造芯行列 ·聚焦:人工智能、芯片等行业欢迎各位客官关注、转发前言:随着腾讯的布局,目前几乎全球所有的云厂商都进入了造芯的行列,而且都在优先考虑定制设计。作者 | 方文图片来源 | 
  • 重磅!拜登延长禁令,持续施压华为!  中国半导体论坛 振兴国产半导体产业!    5月13日消息,据美媒报道,美国总统拜登宣布延长前总统特朗普2019年签署的行政命令,继续禁止美国企业使用那些存在国家安全风
  • 韩国监狱关不住三星太子 来源/华商韬略( ID:hstl8888)作者/李君图片/图虫创意清算最大的财阀三星李家,是文在寅对竞选承诺的兑现,但他刚刚才撕开一个口子,就已经“站在烈烈风中”了。1/ 危局韩国青瓦台,一封封求情信
  • Intel顶级显卡首次曝光:残暴冲击1.6万核心! 我们知道,Intel重返独立显卡市场的Xe GPU架构分为四种不同级别,从低到高分别是Xe LP、Xe HPG、Xe HP、Xe HPC,覆盖从轻薄本到高性能计算等各种领域。如果说相当于核显级别的Xe
  • 一季度平板电脑市场:苹果稳居第一,华为第二! 5月13日消息,国际数据公司(IDC)全球平板电脑季度跟踪报告的初版数据显示,平板电脑市场在2021年第一季度表现出色,同比增长55.2%,出货量总计3990万台。这种规模的增长自2013年第三季度同
  • 拒绝亮机卡:AMD这次太良心了! AMD RDNA2家族已经诞生了两个核心,包括RX 6900、RX 6800系列的Navi 21、RX 6700系列的Navi 22。据说,接下来的RX 6600系列将会使用Navi 23小核心。那么
  • 计算摄影的威力,一加 9 Pro广角体验 “方便”,一直被很多人所追求。上班顺路有早点摊,是一种“方便”;入住的酒店楼下有便利店,也是一种“方便”。可能有人会说,图方便不就是“懒”吗?这种看法不完全错误,但可不适用于所有情况。如果用更方便的做
  • 中国电信5G承载STN集采:华为、中兴、烽火和新华三中标 5月12日,中国电信公示《2021年STN设备建设工程集中采购项目》STN-B标包中标候选人。根据评审结果,中标候选人推荐如下:1.第一中标候选人(1)单位名称:华为技术有限公司和华为技术服务有限公司
  • 干货 | PCB板中的抗干扰该如何设计? ▲ 了解更多精彩内容 点击上方蓝字关注我们抗干扰问题是现代电路设计中一个很重要的环节,它直接反映了整个系统的性能和工作的可靠性。对PCB工程师来说,抗干扰设计是大家必须要掌握的重点
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了