广告

挤牙膏的艺术:苹果M2云评测

时间:2022-06-09 09:52:59 作者:黄烨锋 阅读:
M2的主要改进:GPU增加核心,CPU提升能效,内存升级到LPDDR5,媒体引擎加强——剪片子更快。虽说M2总共200亿晶体管数量相比M1增加了25%,但实际上更多的晶体管应该都用来堆GPU核心、AI单元核心,以及更大的cache了。从这个角度来看,M2其实没有带来多大的惊喜。
广告

前不久的Computex大会上,英伟达在其主题演讲中相对罕见地将自家GeForce RTX 3080 Laptop和苹果M1 Max的GPU做了性能比较,具体结果如下图:

要说英伟达为什么要给出这番比较,大概是因为去年苹果发布MacBook Pro 16"和M1 Max的时候,特别提到M1 Max的GPU性能堪比GeForce RTX 3080 Laptop,而且功耗还低很多。做了这么多年GPU的英伟达听到这种话,必然是要不爽的:要PPT吊打,谁还不会啊。

这组性能对比的项目包括了Photoshop、达芬奇、V-Ray等,从小字还是能看出对比偏向于GPU的通用计算加速、一些AI任务负载,其中还包括了CUDA模式下的V-Ray GPU基准测试。这其实是在欺负苹果GPU生态贫瘠,以及嘲笑其硬件堆料那么多,到头来连英伟达的甜品卡3060都比不上,谈什么“堪比3080”,简直是笑话......

这个例子充分说明了,芯片性能、能效之类的比较,看你想比啥,谁吊打谁真的不一定。或许很多读者会觉得英伟达是特意挑了一些苹果不擅长的项目来比,但实际上苹果在自家芯片的性能宣传上比这还要过分。这次WWDC主题演讲上,M2芯片的数据比较也大致如此。本文,我们来谈谈这颗万众瞩目的苹果M2芯片,又一次“云”解析。

M2,升级幅度不大

先来看看M2的一些基本参数:

苹果照例在M2这颗芯片上没有给出更具体的数据,比如说处理器频率、核心代号是什么。大方向上,芯片层面相比上一代M1的主要提升包括:CPU性能提升18%,GPU性能提升35%,AI单元(Neural Engine)算力提升40%(15.8TOPS),内存带宽提升50%(100GB/s),内存容量最高提升50%(24GB),新增ProRes编解码加速引擎。看起来都还不错。

CPU和GPU更新应当仍然是大众最关心的。CPU部分,苹果硬件技术高级副总裁Johny Srouji在发布会上说:“性能核心(大核)更快,采用更大的cache;而能效核心(小核)则在性能方面有了大幅提升。”从这句话是有理由推断,M1→M2的CPU部分提升,非常类似于A14→A15(iPhone 12→iPhone 13)。而且A15也是基于台积电N5P工艺,M2延续A15的部分设计是比较合理的。

M1本质上就属于扩大了规模的A14,包括两者CPU大核微架构都是Firestorm,小核都是Icestorm,只不过核心频率、缓存大小、核心数、TDP等具体规模存在差异。再基于苹果给出M2 CPU的cache大小,M2大概率就是A15的规模扩大版。

因为如果苹果真的给M2换个全新的架构,那么基于Arm阵营指令集已经更新至Armv9,苹果应当在近代CPU上尽快迁移到Armv9才对;但苹果本次发布会完全没有提到这茬,也充分说明M2的CPU还在用旧架构。

因此合理猜测M2的CPU大核为Avalanche,小核为Blizzard。A15芯片的一大特点就是CPU性能提升幅度比较小,重在能耗比、效率的升级上:尤其体现在Avalanche大核各方面相比于A14的大核都只是小改,提升主要体现在核心频率和cache大小的变化;但Blizzard小核变化相对较大,包括存储子系统TLB,后端还新增了1个额外的ALU整数单元。

这相当符合前文引用的Johny Srouji在发布会上对于M2大小核变化的评价。苹果给出的数据是,M2相比M1,CPU性能提升18%。这里18%的性能提升是说多核性能,但苹果没有说对比的究竟是什么(官网脚注中只说基于某些“行业标准benchmark”)。另一个重要指标依旧被忽略:单核性能(或IPC提升)。目前苹果CPU的单线程性能已经落后于Intel;苹果的单线程性能增长至少需要看A16芯片的改进。

而这18%的CPU多核性能提升,其中有一大部分应该是Blizzard小核微架构改进带来的。到更系统的真实负载测试里,M2相比M1的CPU性能提升幅度应当不会很大;略有挤牙膏的嫌疑。不过能效方面的提升依然相当不错,这是苹果的传统强项了——N5P工艺在此应助力不少。

GPU部分,苹果给的数据是M2相比M1性能提升35%,对比项目依旧不明。35%的提升幅度看起来还不错,但须知M2的GPU相比M1多加了2个核心(核心数提升25%),而且共享L2 cache也加大了(虽然不知道加大了多少)。所以M2 GPU的峰值性能也需要更高的功耗(看图大约为15W)。而同功耗下,M2 GPU依然有25%的性能优势。提高核心数的操作,也和A14→A15如出一辙。与此同时M2一样有残血版:阉割了2个GPU核心(8核心版),作为MacBook更低配置出售。如此一来,残血版M2的GPU性能相较于M1的提升应当会极其有限(<10%)。

另外值得一提的是内存控制器支持到LPDDR5,达成内存带宽100GB/s——相比于M1提升了50%。100GB/s在低功耗移动平台相比竞争对手仍然是个鹤立鸡群的值,带宽高出隔壁数倍;不过自从看过M1 Max的400GB/s以后,大家好像已经没有那么震惊了。这种大带宽,加上苹果的统一内存架构,对于GPU而言会很有价值。有关GPU部分,后文还会进一步谈到。

M2芯片其他部分比较值得一提的是苹果的传统艺能,媒体引擎的进一步加强——这显然是为多媒体创作者准备的,尤其为宣传中领先竞争对手“x倍”的数据提供了理论支撑。这两年PC处理器制造商似乎都在媒体引擎方面内卷。从大方向来看,这属于添加专门的处理单元,来大幅提升某一类工作效率的方案。

M2除了支持8K H.264和HEVC格式的视频解码之外,另外带上了专用的ProRes视频编解码器;系统层面ProRes格式转码的速度能有3倍提升。这对视频工作者还是相当有价值的,也是苹果很清楚自家笔记本究竟卖给谁的证明——死死把握住自己的多媒体创作、剪片子用户市场。这次的媒体引擎更新似乎是向M1 Pro/Max看齐的节奏。

其他方面的配置更新还包括AI单元、新的ISP、新的Secure Enclave等。比较值得一提的是,M2在I/O方面依然比较孱弱,和M1一样还是只支持外接1个最高6k分辨率60Hz显示器;USB-C口也并非高规格的雷电4。这就相当的不高级,或许苹果也是希望更Pro需求的用户还是考虑14/16寸Macbook Pro产品为宜。

总结一下M2的主要改进:GPU增加核心,CPU提升能效,内存升级到LPDDR5,媒体引擎加强——剪片子更快。虽说M2总共200亿晶体管数量相比M1增加了25%,但实际上更多的晶体管应该都用来堆GPU核心、AI单元核心,以及更大的cache了。从这个角度来看,M2其实没有带来多大的惊喜。

借此也不难发现,即便是苹果这种设计能力很强的企业,也很难在不堆砌硬件资源的情况下,获得多大程度的性能提升。比如单线程性能,历史上不同市场参与者对核心微架构的一众奇技淫巧皆已发挥完毕,苹果也跳不出这个框架。不过有一说一,A15本身已经足够优秀,M2虽然没能带来M1问世时的那种惊喜,但在能效方面也依然出类拔萃。

M2的那些夸张对比数据

正儿八经地聊完M2芯片,接下来是常规的吐槽环节,即苹果给出的那些数据靠不靠谱,尤其是和“竞争对手”之间的比较数据。

芯片层面,苹果宣称相比“最新的10核PC笔记本芯片,M2的CPU在同功耗下能够提供将近2倍的性能(1.9倍)。而且要达到这颗PC芯片的峰值性能,M2仅需其1/4的功耗”。从苹果提供ppt的小字来看,这里的10核PC笔记本芯片是指Intel酷睿i7-1255U(TDP 15W, PL2 55W)。

其实在性能方面对比Intel 12代酷睿的U系列是不大合理的,今年的酷睿U系列低压处理器普遍配了2大核(P-core)+8小核(E-core),这样所谓的“10核处理器”显然和Intel面向笔记本更主流的6大核+8小核配置不同。

另外苹果宣称,还对比了“最新的12核PC笔记本芯片——这颗芯片需要多很多的功耗才能提供性能上的增加”(如上图),“M2提供这颗芯片将近90%的峰值性能(87%),与此同时功耗仅为其1/4”。这里的“12核PC笔记本芯片”说的是酷睿i7-1260P——这次倒是比了P系列。但实际上,i7-1260P并非12代酷睿P系列中性能最强的处理器,P系列中顶配的酷睿i7-1280P还多了2个大核心,在绝对性能上应当会显著优于M2 CPU。

所以CPU的性能对比对象选得并不算靠谱,而且我们也不知道究竟比了啥。基于苹果宣称M2 CPU性能大约相当于酷睿i7-1260P(MSI Prestige 14 Evo)的87%,有兴趣的同学可以去查Cinebench R23/Geekbench 5之类的线上跑分成绩,推算一下M2 CPU和酷睿i7-1280P的性能差距有多少(不过不同OEM厂商对P系列处理器的功耗设定差异甚大,很难做比较)。

都是低压处理器,M2的CPU实则很难在性能方面与12代酷睿一较高下,但必须赞赏其功耗表现一如既往的低——能效相较12代酷睿也就好了几个量级。尤其更低性能区间的功耗表现很出色,与台积电的工艺关系也很大。不过请注意,做高性能也没那么简单,尤其在苹果这种超宽微架构的前提下,随便提个频都并没有那么容易。

GPU部分与竞品的对比,苹果宣称M2 GPU相比酷睿i7-1225U核显,同功耗下性能领先2.3倍。那么实际对比对象,也就是Intel这边的Xe核显,规格为96EU(执行单元)。但实际上x86阵营,目前最强的核显是AMD Ryzen 6000移动系列的RDNA 2;而Xe旧架构,Intel已经用了2-3年,今年年底的13代酷睿预计会有大改。

从苹果给出这张图的纵坐标标尺来看,M2 GPU的峰值性能大约相当于96EU Xe核显的2倍不到(可能在1.8倍左右);那么有理由推测,M2 GPU的性能应该不及AMD移动平台的RDNA 2核显——虽然感觉AMD因为缺货,Ryzen 6000移动处理器还是没能大规模铺货。当然,在此苹果的优势还是在能效上。只不过以苹果GPU的生态,冲着苹果GPU去买MacBook Air显然是毫无必要的。更何况大部分用户选购MacBook Air,还是会选择M2残血版——也就是少了2个GPU核心的版本,核显性能其实就更不值得炫耀了。

不过Intel、AMD和苹果三家现在开始卷处理器核显,也算是件好事。

15倍速度领先和GPU生态构建

讲完芯片层面,再从系统层面——笔记本整体的角度来看看苹果给出的另外一些数字。顺便也来聊聊苹果在这次发布会上表现出的构建GPU生态的努力。

苹果官网宣传页,针对MacBook Air笔记本整体的性能宣传数字包括(1)相比M1版MacBook Air,速度提升1.4倍(2)相比更早的Intel版MacBook Air,速度提升15倍。

“15倍”实在是震惊啊有没有,当代笔记本比前两年的笔记本性能提升15倍...摩尔听了都甘拜下风。苹果在系统层面的对比项目还是非常的“我行我素”。一方面,苹果对比的Intel处理器是8代酷睿,这都5年前的处理器了;另一方面,15倍对比的具体是用Final Cut Pro 10.6.2来执行一个4K ProRes 422视频文件工程,然后比比两者的执行时间。

还记得前文提到的吗?M2的媒体引擎特别增加了专用的ProRes硬件加速编解码器,而2017年的8代酷睿显然还没有这样的配备,所以有15倍的速度优势。这才叫用自己的长板,去比人家没有的板啊......不过实际上苹果官网给出的对比项目里,15倍还不是最夸张的。

有一个对比项目是用Final Cut Pro去转码一个55秒长度的4K ProRes RAW格式视频,转为ProRes 422格式。M2的转码速度相比M1领先3倍,相比8代酷睿领先了24倍!苹果没有用24倍来做宣传,还是可惜了。其余对比项目包括Photoshop应用滤镜和函数、Premiere Pro的4K H.264媒体文件处理、Lightroom拼接图片等等。

只能说苹果对比的几乎都是自己的长板,但从另一个角度也说明苹果对自己的目标用户群体非常了解:毕竟很大一部分Mac用户的确会用设备来进行多媒体剪辑、创作等工作;这些数据在此也就有了实际价值;不管它们对于反映处理器综合性能有多么缺心眼。

不过我们在苹果公开的测试项目中,也发现了游戏性能对比《博德之门3》高画质下,M2相比M1有1.3倍的性能优势。这表明苹果仍然有做游戏生态的渴望。

GPU生态(或者macOS生态)始终是苹果的一大短板,所以我们才能看到文首英伟达用一张PPT吊打M1 Max,苹果就是吃了生态的亏。有关苹果GPU生态,能聊的东西很多。比如说苹果GPU沿袭了Imagination PowerVR GPU,整体是一种TBDR基于tile的延后渲染架构;图形渲染流水线和传统的桌面GPU有着较大差异。前不久,新西兰的一名数据科学家就特别撰文谈到了其中影响。他认为大量从未针对TBDR存储系统优化过的app,在M1 Ultra配备的32MB TLB面前会出现严重的效率问题。有兴趣的同学可以去深究一下,此处不多做探讨。

其实过往我们针对M1进行Blender、Geekbench通用计算加速测试就已经发现,苹果GPU堆了那么多的晶体管,真正可参与实际工作的却少得可怜。即便是号称已经适配了苹果芯片的Blender 3.1,用M1 Pro来渲染其中基准测试的BMW项目,其GPU功耗就只用到8-9W,离满载还差得远,就知其生态与英伟达的巨大差距。

不过在WWDC主题演讲上,我们还是看到了苹果在生态方面的努力的。在macOS系统更新中,苹果特别提到了对于Metal API的更新。比如说Metal 3引入了一个叫做MetalFX Upscaling的特性。苹果在发布会上说,“渲染更小、更少的计算密集帧,并应用高质量的空间升格(spatial upscaling)和时域抗锯齿(temporal anti-aliasing)”就能以更快的速度渲染复杂的场景。

这应该是一种很类似于英伟达DLSS超分技术的方案,也是现在图形计算的主流方向。另外苹果还提到对于更复杂、丰富的文理贴图等素材,增加快速资源加载API,能够最小化等待时间——具体是从SSD到统一内存系统的直接路径,GPU能够快速访问高质量的贴图和buffer,不需要等待。听起来有没有很像微软的DirectStorage API

发布会上,苹果还很罕见地邀请到了Capcom站台。卡普空作为主流游戏公司,主要就谈到利用Metal 3的这些新特性,令《生化危机:村庄》这个游戏也能流畅地以1080p分辨率跑在M2版MacBook Air上,虽然不知道是何等画质。我们认为,这还是值得期待的。虽然针对GPU图形计算站台的,似乎也就只有卡普空一家。以苹果在芯片设计能效上的优势,做大生态才有机会真的去“媲美”GeForce GPU,虽然这需要很长时间。

M2仍然是低功耗轻薄本市场上最优秀的处理器,虽然我们认为它相比M1挤了牙膏,而且在绝对性能方面也算不上多先进,但能效、效率仍是其巨大优势项。不过比较奇怪的是,M2 CPU在加大cache资源,改用N5P工艺的情况下,其日常工作功耗应该会更低才对;加上新版MacBook Air的电池容量还加大了,其续航表现应该会更好才对。但苹果官网给出MacBook Air的续航仍然和上代一样,不知是否是屏幕等其他组件的关系。

另外,苹果芯片设计惯常的超宽微架构,不大在乎die size的风格,也让M2版MacBook Air的价格直接达到了万元水平,还得选配16GB RAM和512GB SSD,一万三的价格实在是没兴趣跟你们玩什么低端市场。当然从整机角度来看,MacBook Air的吸引力其实并不单在M2芯片上,这就是另外的话题了。

责编:Luffy
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
黄烨锋
欧阳洋葱,ASPENCORE 资深产业分析师,常驻上海,专注成像、移动与半导体,热爱理论技术研究。
  • 谷歌挖IBM人才造处理器,元宇宙也10倍薪抢人才? 近日谷歌挖走了在IBM工作了21年、负责IBM Z System芯片的首席架构师安东尼·萨波里托(Anthony Saporito),担任其首席架构师,负责下一代处理器设计。
  • 愈夜愈美丽,2022骁龙之夜上的极致移动体验 2022骁龙之夜上,从手机芯片,到智能驾驶,再到元宇宙,高通再次为业界诠释骁龙是如何为用户所期待的顶级移动体验树立标杆的。
  • 拆解小米12:搭载高通骁龙8 Gen1处理器,散热是怎么处理? 小米12主板依然采用双层板设计,这也是大多数高通旗舰处理器会采用的设计。考虑到新一代处理器的散热需求,小米12在主板芯片、电池、摄像头、屏幕、扬声器、无线充电线圈都准备了大量的石墨贴或是导热硅脂散热。在LDS天线位置还特意增加了白色石墨烯。导热铜管的面积也有所增大。
  • 拆解荣耀60:采用导热硅脂+石墨片散热,国产器件比例再度 荣耀60拆解难度中等,可还原性强。共采用20颗螺丝固定,采用比较常见的三段式结构。SIM卡托、USB接口处采用硅胶圈保护,能起到一定的防尘作用。采用导热硅脂+石墨片的方式进行散热,并未采用液冷管。器件方面的选择,荣耀60中可以看到有众多国产厂商的。
  • 实现系统级效能、功耗与面积的3D-IC小芯片设计 在同一封装中将芯片做3D立体堆栈,和使用硅中介层的多小芯片系统2.5D封装,已经成为新的解决方案。当然,这两种方式也面临着各自的挑战。
  • 元宇宙热潮下,Meta自研7nm芯片,英伟达研发VR超薄全息眼 Meta Reality Labs的研究人员已经制造了一款VR头戴设备原型机,该原型机可以支持Codec Avatars项目的渲染,搭载了专门用于AI处理的定制加速器芯片。此外,英伟达与斯坦福大学展示了一种用于VR的超薄全息眼镜构思......
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。
  • 龙蜥社区:Anolis OS 23正式版将于 近日,龙蜥社区对外公布了下一代龙蜥操作系统(Anolis OS 23)研发路线图,PoC版已在社区官网上线,正式版本将于2023年发布,它支持X86、ARM-v9、RISC-V等多种芯片架构,并集成更多核心自研组件。
  • Matter标准:助力智能家居实现更高水 智能家居行业领先的供应商和潜在供应商已携起手来,为智能家居产品的互通性采取进一步行动,制定新的标准,即基于互联网协议(IP)的Matter标准。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了