在看本文之前,建议感兴趣的同学先去了解一下12代酷睿P-core与E-core的微架构分析——此前的这篇文章我们也谈到了对这种混合架构做调度的Intel Thread Director技术。本文从更系统的层面来谈谈12代Intel酷睿桌面处理器,以及我们在发布会上听到更多可在此给出的细节信息。

今年12代Intel酷睿桌面处理器(产品代号Alder Lake-S)宣传活动还是相当的盛大,除了10月28日全天的发布会之外,事实上在此之前的2天,面向媒体就已经有会前沟通会,以及演示活动了。

前两个月的Intel Architecture Day上,我们仔细分析了这代酷睿CPU处理器的两种核心架构,分别是代表性能的P-core(代号Golden Cove),以及代表效率的E-core(代号Gracemont)。此前的总结中我们就提到过,无论哪种核心,都称得上架构层面的大跨步。

其中P-core实现了相比上代(11代酷睿Cypress Cove核心)19%的IPC提升,比Skylake->Sunny Cove的提升还要大;而E-core虽然只是“效率核心”,但在单线程性能方面,同功耗下相比Skylake(10代酷睿)也有最多超过40%的性能提升,多线程最多有80%性能提升,功耗至多降低80%。

按照核心层面理论上的性能提升,要摆脱隔壁AMD的纠缠已经是小菜一碟。而且12代酷睿在绝对性能上应该是能够超过最近被吹得神乎其神的M1 Max的,虽然在功耗方面大概仍然会有一定的弱势。而Intel本身也对12代酷睿寄予了厚望,称其“重新定义x86架构的性能”,以及在宣传口号上提“异构强芯,一战封神”,并且把Alder Lake-S称作“世界上最出色的游戏处理器”。

在看本文之前,建议感兴趣的同学先去了解一下12代酷P-core与E-core的微架构分析——此前的这篇文章我们也谈到了对这种混合架构做调度的Intel Thread Director技术。本文从更系统的层面来谈谈12代Intel酷睿桌面处理器,以及我们在发布会上听到更多可在此给出的细节信息。

首发的几款Alder Lake-S新品

先来看看Intel本次首发的几款12代酷睿桌面处理器新品,具体如下图所示。包括了最高端8个P-core与8个E-core的酷睿i9-12900K(24线程);酷睿i7系列普遍是8个P-core加4个E-core(20线程);i5系列则为6个P-core加4个E-core(16线程)。

I/O的主要亮点包括对于DDR5(4800 MT/s)、PCIe Gen 5(16 lanes)的支持。还有相关睿频、缓存cache方面的信息此处也不再一一赘述,看图即可。值得一提的是,表格右边的功耗部分并未像往常一样,以TDP来标注。这将在后文中做解释。

Cache方面可做补充的是:Intel表示在混合架构之下,“对缓存进行了进一步加强。在增加P-core二级缓存与E-core每核二级缓存的情况下,我们同时在共享的L3智能缓存上也进行了增强和容量扩充。” L3 cache最高为30MB。

核显这次编号叫UHD Graphics 770,似乎相比去年的11代酷睿(Graphics 750)是有提升的,具体不知道提升了哪里。不过作为桌面处理器的核显,集成的Xe core核心数量应该会比较有限。

有关Alder Lake-S的其他信息还包括,采用Intel 7制造工艺(原10nm Enhanced SuperFin),LGA1700封装——也就意味着旧主板是不支持Alder Lake-S的。新主板搭配的是Intel 600系列芯片组。从主板厂在京东的销售信息来看,Z690芯片组的主板过几天才会上市。600系列芯片组的相关提升会在后文中详述。

有关E-core扮演角色的简单补充

此前虽然我们已经用了相当大的篇幅去探讨Alder Lake两种核心架构,以及配套混合架构的Intel Thread Director辅助调度技术。不过这次的发布会,Intel还是公布了一些新料。在谈具体的产品之前,与各位做简单分享。

首先是有关E-core在系统中的作用。鉴于隔壁Arm的宣传,我们习惯上把不同核心放在一起的这种架构称作“大小核”设计。所以大部分人对于Intel推混合架构中的E-core,是秉承其作为“小核心”的思路的。

E-core在整个系统中的确有提升效率的价值,比如在笔记本平台能够更大程度地节电。但就像此前架构分析文章中提到的,E-core在核心规模、宽度上远超Arm的小核心(如Cortex-A55),是个标准的乱序核。

而且这一代E-core(Gracemont)的单线程性能(SPECint)相比Skylake在同功耗下至多提升40%,多线程(4C4T)提升至多80%(同性能下,功耗降低80%)。当然这个对比是基于特定频率,而且并未涉及浮点性能。不过这也意味着12代酷睿即便是E-core,也在某种程度上比10代酷睿的“大核”性能更彪悍、更节能。

我们在这次活动上向Intel提了个问题,即P-core是支持超线程的。当某个任务有16个线程需要处理时,12代酷睿处理器会优先于将16个线程塞满8个P-core并启用超线程(8C16T),还是更倾向于8个线程给P-core,另外8个线程给E-core(16C16T)。

Intel院士Guy Therien在回答这个问题的时候特别提到,超线程通常能够带来30%的性能提升,但E-core却可获得80%的额外性能。“所以在填充核心的时候,首先会挑选P-core——因为其性能出色,随后就挑选E-core。在它们都被填满以后,才会考虑P-core的超线程。”

这个回答其实能够较大程度表明,E-core并非“小核”。Intel方面似乎一直在强调E-core对于多线程吞吐提升的价值。此前我们也说E-core以足够小的占die面积,实现了相对高效的多线程性能提升(四个E-core,面积差不多相当于一个P-core),绝对是Cinebench这类基准测试的刷分利器(妈妈再也不用担心隔壁chiplet-based堆核战术了)。

在demo演示中,Intel也分享了几个有趣的场景,包括一边玩游戏,一边在推流平台做游戏直播——则E-core将在其中发挥非常好的作用,游戏帧率相比以往会有个显著提升。演示中Intel用《骑马与砍杀》+在斗鱼平台推流——相比竞品(AMD Ryzen 5950X)的游戏帧率领先幅度可以达到40%左右;而在未开启E-core的情况下,领先幅度则在20%左右。

另外一个演示场景是,同时用Premiere和LightRoom——当后台做Premiere视频输出时,前台执行Lightroom照片转换工作,会有相当大幅度的速度领先。不过感觉大约很少会有人真的这么去用电脑吧。

Intel针对混合架构可实现性能提升的问题,预设了一些前后台或其他多任务工作场景,具体如上图所示。这其实也是桌面平台为何也用E-core的原因,毕竟它的确不是“小核心”。Intel这次在分享活动上说,一定要形容的话这俩应该是“大核”和“大大核”。

其实有关E-core、P-core以及超线程该怎么用的问题是相关于调度机制的。Intel Thread Director是Intel针对混合架构设计的一种线程调度辅助技术。因为不同核心构成同一个处理器,谁跑在P-core上、谁跑在E-core上,以及何时进行线程迁移,都是影响使用体验的关键。而Intel Thread Director在工作时可以给操作系统scheduler提供更细致的“hint”,帮助操作系统进行调度决策。

这也是Intel与微软Windows 11合作开发的技术,此前我们特别撰文谈了这项技术。其基本原理以及调度的一些典型场景,本文就不再细数了。

另一个值得一提的问题是这次的12代酷睿是不支持AVX-512与AMX(Advanced Matrix Extensions,一种AI加速单元)的。但实际上我们知道,应用于数据中心的Sapphire Rapids支持这两大特性。这表明这代P-core(Golden Cove)在设计上是有AVX-512与AMX硬件基础的。

而12代酷睿之所以不支持这两者,最大的原因应该是E-core不包含对AVX-512与AMX的硬件实现。基于一般情况下,同一颗CPU中,不同架构的核心需做到相同的指令支持这一点,12代酷睿处理器芯片也就不再支持AVX-512与AMX了。

所以我们问了Intel,未来是否有计划推出仅包含P-core(而不包含E-core)的PC处理器。Intel对此表示需要等待后续公布的消息。另外关于能否通过关闭E-core来开启P-core中的AVX-512和AMX特性的问题,Intel的回复是“不能”。

有关Alder Lake-S的性能提升

这代P-core(Golden Cove)相比11代酷睿核心(Cypress Cove)在IPC方面有19%的提升,这一点此前分析P-core架构的时候已经谈到过了。隔代19%的IPC提升还是相当耀眼:Golden Cove作为微架构基础,未来应该会在Intel后续的处理器产品中延续比较长的时间。这其实也是12代酷睿有革新意义的原因所在。

这次Intel也给出了更多的数据,上面这张图是以10代酷睿(Comet Lake-S,Skylake核心)为基准,在固定频率下,整数性能(SPECrate2017_int_base)的变化。12代酷睿的P-core(Golden Cove)较之有28%的提升。而尤为值得一提的是,E-core(Gracemont)也有1%的领先——这里还没有呈现功耗方面的优势。

这其实也能看出,近几代Intel产品在核心性能方面的显著变化。

结合两种核心之后,上面这张图对比了酷睿i9-12900K与上一代的i9-11900K。以酷睿i9-11900K在250W峰值功耗下达成的性能为基准,i9-12900K在不同功耗下可实现的多线程性能成绩如上图所示。

这张图有两个亮点,其一是i9-11900K的峰值功耗241W下,相比上代达成50%的多线程性能提升。更重要的是,要达到上一代相同的性能水平,只需要65W的功耗,即上代1/4的功耗。这样一来,12代酷睿理应会有更多的机型设计自由度;而且也让我们更期待移动平台的12代酷睿产品。

尤为值得一提的是,在前文中新品规格表里,首次出现了“processor base power”和“maximum turbo power”这样的功耗词汇。从Intel的解释来看,基础功率(base power)是指PL1状态下的功耗;而最大睿频功率自然就是指PL2状态下的功耗了。

关注PC的同学应该很清楚,PL2是个短时睿频状态:处理器在该状态下,可维持很短的时间达成性能突发量;而PL1是相对稳定的长时睿频。这次最高配的酷睿i9定义最大睿频功耗为241W。

Intel表示,在散热理想的情况下,可设定PL1=PL2=241W。因为这次的芯片可以长期稳定工作在241W功率下。

系统性能上一代和对手的比较

以这种程度的核心性能提升,虽然在制造工艺上仍然会在短时间内落后于竞争对手,但AMD在微架构设计上,恐怕很难在接下来要发布的Zen 4上实现赶超。接下来谈谈系统性能,这应该才是更多人关心的问题。

作为强调“游戏”的处理器,上面这张图是i9-12900K与上代i9-11900K在各类游戏上的性能比较(其他配置包括12代酷睿采用DDR5-4400内存,Geforce RTX 3090显卡)。Intel测的游戏还真是相当多,从《彩虹6号》到《英雄联盟》。

综合性能提升取几何平均值,则12代酷睿的性能提升幅度大约为13%(Intel提供的另一组数据是13-28%,可能测试环境和样本量有差异)。像《英雄联盟》这样的游戏,性能提升幅度大约有40%。

和对家的5950X比比(这次总算是比最顶尖的5950X了)。这张表中包括《古墓丽影》《孤岛危机》《F1赛车》等游戏。酷睿i9-12900K在大部分游戏中都比AMD的线程撕裂者彪悍。不过这一点应该是完全在意料之中的。只是这个对比其实并未发挥AMD使用自家GPU在系统架构层面优势,该对比同样基于英伟达RTX 3090。

另外AMD Ryzen 5000系列不支持DDR5,对此Intel表示12代酷睿也支持DDR4。“同样的,我们将30多款游戏在DDR4上做了详细评估,得到的结论还是相同的。DDR4之上的游戏性能同样高于竞品和11代酷睿产品。”

在昨天的体验活动中,Intel现场展示了自家产品与AMD在游戏过程中的实时帧率、功耗和温度方面的差异。在《超级赛车》这样的游戏里,能表现出相当大的性能差异;而且CPU温度也显著低于AMD的线程撕裂者。这算是真切地在新一代产品中扳回一城,即便Intel 7工艺接下来要迎战的是台积电N5。

有关散热的问题,Intel也在会上提到了一个细节。这代酷睿处理器的封装再度做了优化。此前我们就知道,Intel通过做薄die的部分,而做厚上方的IHS(Integrated Heat Spreader)散热器来提升散热效率。12代酷睿桌面处理器的IHS进一步做厚,将STIM(Solder Thermal Interface Material)钎焊散热材料做薄了,来进一步提升散热效率。

另外需要单独提一提混合架构中,E-core在游戏场景中可发挥的作用。前文已经提到,即一边玩《骑马与砍杀2:霸主》这款游戏,一边跑游戏的流播与录制(OBS)。酷睿i9-12900K的E-core能帮上很大的忙(主要是针对OBS的流播与录制任务),最终可让游戏帧率提升84%。如果没有E-core的话,那么相比前代的提升则在19%左右。

值得一提的是,Intel这次专门与游戏工作室合作的游戏包括《杀手3》《反恐精英:全球攻势》《骑马与砍杀2:霸主》《全面战争传奇:特洛伊》等。《骑马与砍杀》应该是这其中对多线程并行能力利用率比较高的游戏,所以能够表现出更大的性能优势。

说完游戏,自然要说内容创作了。Adobe全家桶,包括Lightroom、Premiere、After Effects,以及其他各种工具,从照片、视频编辑,到2D、3D建模和多帧渲染等工作,12代酷睿相比前代的性能变化如上图。

这里After Effects Plus Benchmark能够充分利用并行计算资源来做视频处理,所以性能提升幅度达到了翻番的程度。E-core在这其中应当也起到了相当大的作用。这些内容创作工具中,Intel同样有生态合作方面的例子。这次Intel特别提到了VEGAS Pro——在程序上较早开始利用VNNI指令集。这种生态合作的工具,事实上总是能达成更高的硬件利用率。

此处Intel为了表现其混合架构优势,列举的一个多任务工作场景是一边用Lightroom导出照片(RAW->JPG),一边用Premiere导出视频。在E-core参与工作的情况下,并行处理这两项工作,能够达成相比上一代47%的速度提升。

这一例中。“照片编辑是短期操作行为,会被拉到P-core去操作;而视频转码用Premiere会被移到后台。”是两种核心配合工作的典型场景。

前文我们已经提到,其实这样的工作场景还是挺少见的。不过或许的确有摄影师存在此种工作需求,一边剪片子、一边给照片调色——摄影师本人仿佛也是多核工作状态…

还有个生产力性能场景,包括一些办公工具的性能变化,i9-12900K相比上代产品的变化如上图所示。不过在多媒体内容创作以及生产力方面,Intel并未给出与AMD的对比数字。

600系列芯片组与超频

最后来说说搭配12代酷睿桌面处理器的Intel 600系列芯片组(PCH),以及处理器及周边的官方超频选择——这也是现在Intel发布会必提及的项目,毕竟很多会选购桌面CPU的同学都是发烧友爱好者。

其实600系列芯片组能提的亮点不多,高端定位的Z690芯片组支持PCIe 4.0,“配合原有的PCIe 3.0,在芯片组上我们一共交付了28条PCIe连接接口,极大丰富了外设连接。”

这里有个亮点在于,芯片组与CPU连接的总线升级至x8 DMI Gen 4.0——虽然不知道具体规格,不过猜想应当与PCIe 4.0类似。外设拓宽,做芯片组与CPU连接带宽提升也是应该的。在这一点上,看未来12代酷睿移动版的配置应该会更有意义。

除此之外就是集成Wi-Fi 6E;以及“通过VMD(Volume Management Device)可以更好实现在PCIe下的设备管理,灵活进行设备组合管理”。

而在官方超频选择方面,对用户而言主要有几个新增的超频功能。其一是,E-core也可以超频,而且在XTU工具中可以针对单独的核心做超频设置。P-core与E-core倍频可分别做调整,Ring/Cache频率、核显频率等都可以做调整。

其二,配套DDR5,Intel推出了XMP 3.0。对于用户而言,XMP 3.0增加到了5个profile可选,有新的电压选项;其中有2个profile可以由用户手动修改一些时序特性——这一点在过去是没有的。PMIC如今是跟着DDR5走的,“DDR5电源管理IC目前有三个电压:VDD、VDDQ和VPP,这三个电压都以JEDEC与英特尔XMP做规范。”…“主板厂不需要去认不同厂商的产品,由Intel来做超频相关的电源IC规范。”

“我们提供这么多的频率、电压、timing…所需的位置会更大。以前是78bytes,现在是384bytes需求。”Intel方面表示,“这些XMP的规格与电源管理IC以及SPD的规格都有关联,互相做参考。这些规格让内存厂商做验证,然后将其验证结果交给Intel。Intel确认之后,将其列为Intel认可的DDR型号。”

XMP 3.0还是相当值得发烧友们去研究和把玩一番的。

在昨天的演示环节,Intel演示了用XTU工具,直接在操作系统中就可以进行内存超频的实时切换,从4800 MT/s超到5200,而不需要切到BIOS下去设置。

其三,内存超频部分这次Intel新推了一个Dynamic Memory Boost动态内存频率调整特性。可以根据当前负载自动进行内存频率的切换,即在可达到XMP设定“超频”频率的基础上,也能在不需要的时候回到默认频率。

最后就是XTU(Extreme Tuning Utility)这个官超工具的一些特性加强。在XTU 7.5版本中,除了前文提到的对不同核心做超频设置,对内存做XMP超频,Intel还特别强调了新增的Intel Speed Optimizer达成核心频率上的“一键超频”。按一个按钮,就能提升至优化过的更高的频率——真正的“官超”。

总结:Intel的关键一役

我们已经拿到了这次Intel新发布的酷睿i9-12900K与i5-12600K,后续将会从某些角度对这两颗芯片的性能和表现做个体验分享。

12代酷睿处理器(Alder Lake)对Intel而言是相当重要的产品。以此前的架构分析和这次官方公布的数据来看,秒杀AMD Zen 3乃至后续的Zen 4应该都不是大问题;而且已泄露的跑分也表明,其CPU部分的绝对性能是优于苹果M1 Max的——虽然因为制造工艺及运营模式的关系,在功耗表现上或许仍然不及。

混合架构,及作为未来酷睿产品架构升级基础的P-core(Golden Cove)都是Intel这两年的集大成之作。基于目前Arm阵营在高性能领域扩展的态势,以及AMD这两年的市场表现,Alder Lake无论对Intel,还是对x86阵营而言,都是异常关键的一役。这也让人更加期待后续要到来的Alder Lake移动版。

价格对应如下:

i9-12900K售价为589美元,国行预售价4999元;

i9-12900KF售价为564美元,国行预售价4699元;

i7-12700K售价为409美元,国行预售价3199元;

i7-12700KF售价为384美元,国行预售价2999元;

i5-12600K售价为289美元,国行预售价2299元;

i5-12600KF售价为264美元,国行预售价2099元。

这些产品目前已经接受预订,预计将在11月4日正式开售,明年年初还会有更多12代酷睿处理器型号问世。

位于华盛顿州的Alder Lake长这样

责编:Luffy Liu

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 不可能intel多核同功耗下能干过amd
阅读全文,请先
您可能感兴趣
在IEDM 2022上,Intel发了多篇研究paper,内容包括2D材料、3D封装技术、断电不会丢失状态的晶体管、嵌入式存储等。我们选择其中一部分来谈一谈,这些技术都有望在近未来,在芯片上发光发热;而对这些技术的了解也有利于我们把握半导体制造技术的未来。
炬芯科技在音频领域深耕多年,承继与发扬近20多年的研发沉淀和经验,特别是在蓝牙音频领域,有着行业领先地位。很重要一点原因,就是炬芯科技在音频领域的不断投入,为追求极致的高品质声音体验,全面提升公司在声学领域的专业水平,炬芯科技建立的声学实验室.....
每年的滴水湖中国RISC-V产业论坛之上,都会有基于RISC-V指令集做芯片的企业做各类产品发布。这个论坛可以看作RISC-V生态发展的风向标。今年的新品除了AIoT芯片,我们认为让人眼前一亮的是基于RISC-V指令集的PC处理器。从这颗来自赛昉科技的昉·惊鸿8100(JH8100)聊起,我们再来看看时隔一年,RISC-V的生态又有了哪些新进展。
5G与AI的融合与协同,是未来技术发展的重要趋势,也是助力移动通信实现革命性突破的关键。通过搭载第5代5G调制解调器到天线的解决方案骁龙X70,和支持高频多连接并发的Wi-Fi 7解决方案FastConnect 7800,第二代骁龙8移动平台向全球用户提供了全频段、最高速率、低时延、稳定的移动连接体验。
L3级自动驾驶汽车本期望在2020年底前上路,而L4级自动驾驶原型也期望今年能够上市。然而对于期待已久的用户来说,可能又要失望了!迄今为止,这两个级别的产品计划都被延迟了,有限推出的也仅仅是概念车。本文探讨延迟原因,并就实现目标尚需做的工作和要求,给出了自己的观点。
联发科已经连续8个季度在全球智能手机芯片组市场份额第一了。不过尽管面对多家机构预测智能手机和PC市场需求疲软的消极消息,高端玩家对还是能保持增长。比如看看高通和苹果......
德州仪器首席执行官Rich Templeton当选SIA副主席
由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
本文介绍了目前比较成熟的已经得到广泛应用的三种信道建模方法并分析了各自的优缺点。坤恒顺维公司可以提供上述三种完整的信道建模软件。优异的信道模型对于准确预测无线电波的传播特性,支持无线通信系统的架构设计极其重要,好的信道建模方法对于用户方便高效的测试验证通信系统的性能更是不言而喻。因此在具体实际应用种,应综合考虑具体环境、条件以及要求有针对性的选择最符合实际测试的方法以提高测试效率。
Qorvo今日宣布将在CES®2023上展示其最新的物联网 (IoT)、智能家居、5G、Wi-Fi、超宽带 (UWB)、传感器和电源产品。
贾浩楠 发自 副驾寺智能车参考 | 公众号 AI4Auto极氪汽车,被曝上市重大进展。根据路透社的消息,极氪汽车已经向美国SEC递交了IPO申请,寻求在美上市。而且是“秘密递交申请”,拟募资10亿美元
文|金融街老李新政后的这一周,在连续上涨5天后,宁德时代出现了连续两天的下跌,市场的热门板块是医药医疗、文旅消费这些“复苏经济”板块。从11月底到现在,新能源汽车板块出现了短暂的“阳春”,宁德时代近5
半导体的风口未来还会持续一段时间,总体来说和储能,电动汽车,光伏等几大新能源行业是未来5年相对预期比较好的赛道。总有同行问,如何判断一个行业是否火爆。我分享一个经验,简历挂在领英上,一般会有猎头联系。
天风证券和芯片超人合办的芯智库今年举办27场汽车和各行业专家沙龙,获得产业强烈反响和评价。我们定于12月21日在上海和科技部中国汽车芯片产业联盟联合举办“芯智库年度大会”和“汽车芯片产业盛会”,本次会
你没看错,张飞实战电子"内部培训视频打包72集",现在限时限量超低价出售。        只要满足以下2个简单的条件,即可0.1元购买       1、对硬件电路设计/开关电源课程有强烈需求     
 日前,在2022世界工业设计盛会上,代表中国工业设计发展高水平的国家级奖项——中国优秀工业设计奖揭晓,大华股份“PTZ全息智能交通卡口相机及一体化薄膜展示系统”凭借出色的设计风范和高度契合
中国北京 – 2022 年 12 月13 日– 移动应用、基础设施与航空航天、国防应用中 RF 解决方案的领先供应商 Qorvo®, Inc.(纳斯达克代码:QRVO)将在 CES®2023 (#CE
今天有空,在GitHub翻了各种库,挑出下面有意思的库~Open.HD 使用现成的商业 (COTS) WiFi 适配器,但它不会在标准 WiFi 模式下运行它们,这不适合低延迟或超长距离视频传输。相反
作为新一代通信、新能源汽车、高速列车等新兴战略产业的核心材料,以碳化硅、氮化镓为代表的第三代半导体在《“十四五”规划和2035年远景目标纲要》中被列为重点。碳化硅6英寸晶圆产能处于飞速扩张期,同时以W
如何看待中国自主汽车品牌冲击中高端市场?背景:11月,比亚迪官宣,旗下高端汽车品牌定名为“仰望”。11月16日,在比亚迪第300万辆新能源汽车下线仪式上,比亚迪集团董事长王传福在表示,明年将推出一款专