去年就听说更新Intel Arc显卡驱动,DirectX 11游戏的帧率能有所提升,那具体能提升多少?玩《原神》也有提升吗?我们做了个测试...

有关Intel Arc显卡“更新驱动、性能就暴涨”的说法,应该是自前年Arc显卡发布之后就广泛传播的。去年我们也做过Arc A750显卡体验,证实了此前这款显卡在更新驱动后,对于不少老游戏的性能加成:也算是印证了更新驱动,约等于换张显卡的说法。

自这一代代号为Alchemist的Arc独立显卡问世以后,Arc驱动的确至少已经更新了几十个大版本:此前我们也打趣说,Intel软件团队估计是加班不少,才在短短这么点时间内更新了这么多的驱动。而且不只是用于支持游戏的驱动,还在于对AI推理达成支持的中间件。这年头做个显卡果然不似往年那么简单了。

最近我们拿到一款来自Sparkle的Arc A770 Titan OC Edition显卡。借此机会,一方面我们想看看为期一年半、几十个版本的驱动更新,对于Arc A770究竟带来了多大程度的游戏性能提升;另一方面也想窥探一下,现在的Intel独显拿来做本地AI推理,能做哪些事,以及AI的实际性能表现如何。

本文是其中的上篇,游戏体验测试部分;后续的下篇会做AI推理,包括LLM大语言模型、Stable Diffusion等在内的体验分享。

 

谈谈Intel的这颗旗舰显卡

Intel Arc系列显卡产品中,目前面向桌面平台最高端定位的就是Arc 7系里的Arc A770了。Sparkle的这块显卡则应当算是其中的最顶配:不仅显存上足了16GB,而且OC超频意味着核心频率相比于普通版本能达到更高。

桌面平台的Arc 7系和5系显卡,中央那颗GPU处理器都是ACM-G10 die,基于台积电N6工艺,总共217亿晶体管,die size 406mm²。相比我们之前体验过的Arc A750,A770开启的算力单元也更多。

相比A750的主要硬件资源差异见下表。另外,从Sparkle的官方资料来看,这颗Titan OC超频版Arc A770的核心频率可以达到2300MHz,比常规版高了200MHz。我们通过FurMark烤甜甜圈测试,看到HWinfo记录最高2400MHz的boost频率,板卡功耗最高230W。

简单说一说测试这枚显卡搭建的平台。主要是选配酷睿i7-14700K处理器,64GB DDR5-4800内存,以及华硕Prime Z690-P WiFi主板。虽然不是顶级平台,但和Arc A770搭配还是绰绰有余的。

此前Intel官方有提过,搭配近两代酷睿i5的CPU,能够看到Arc驱动程序带来最大程度的性能提升;搭配酷睿i7和i9当然也能看到提升,只不过幅度没那么大。

CPU:Intel Core i7-14700K

GPU:Sparkle Arc A770 Titan OC Edition

内存:2 ×32GB DDR5-4800

SSD:1TB三星980 PRO(外挂2TB三星T7 Shield)

主板:ASUS PRIME Z690-P WIFI(BIOS Ver.3202, 2024.2.21)

电源:航嘉GX800X

操作系统:Windows 11 Professional Build 22631.3235(23H2)

值得一提的是,我们搭的平台存在CPU散热瓶颈。从此前的稳定性测试可知,该平台下酷睿i7-14700K稳定状态大约可达到其峰值性能的93%左右(受制于散热风扇)。不过理论上这不会影响到游戏测试,因为基于数据追踪,大部分游戏测试的瓶颈还是在显卡上,CPU在游戏应用里也很难达到长时间的全核满载。

 

有关测试方法:对比3个版本的驱动

我们对于Arc A770的定位认知是,在2k(2560×1440)分辨率下玩大部分3A游戏大作,在特效全开时,应当做到至少平均60fps。所以我们的测试会给出1080p与2k分辨率,不同游戏在特效几乎全开的情况下,平均帧及部分1% low帧数据。

注意,这里的特效全开是指把游戏的图形设置项,除光线追踪以外,能开的尽量都开。某些游戏预设最高档画质(如“极高”或“最高”)其实是没有将特效子项全部打开或开到最高档的,比如《原神》最高档画质预设,“场景细节”和“全局光照”项目就没有拉到最高水平,则我们会将这些手动选择至最高。

对于诸如XeSS、FSR这类超分项目的选择,则主要基于游戏预设推荐。例如《赛博朋克2077》“超级”画质预设开启XeSS 1.2质量档、锐化0.5,则我们在体验测试时也会保留这类项目的选择。这么做对于玩家考虑购入Arc A770应该也会更有实际参考价值。

测试尽量选择内置benchmark程序的游戏——这对表现游戏全局性能需求是最有发言权的,毕竟我们自己选择测试场景会有偏颇。本次测试有3款游戏没有自带benchmark,分别是《原神》《英雄联盟》《半条命2》。

有些游戏自带的benchmark参考价值并不大,比如《无主之地2》——这款游戏在特效全开时,benchmark会把重点放在物理测试上,GPU占用率反倒没那么高;相应的,它不能反映这款游戏自身的游戏全流程性能需求。所以测试个体差异还是需要留意的。

另外更重要的是,本次测试主要是对比不同版本的Arc显卡驱动程序是否带来了性能提升,所以我们选了三个版本的驱动来做对比,分别是3490、4887、5333(31.0.101.x)。选择这三个驱动版本的原因是:3490是Intel于2022年10月发布的首个驱动版本;而4887则是2023年10月——也就是初版发布1年后的驱动更新;5333是截止到发稿前最新的驱动版本。

在测试游戏之前,按照惯例还是先跑一跑3Dmark的几个测试。因为我们发现,几乎所有驱动版本跑Time Spy, Fire Strike之类的测试得到的成绩都差不多,所以直接给结果(系统性能分,非单纯的图形分):

这三个测试分别对应了DirectX 12, DirectX 11与Vulkan API,在此作为Arc A770绝对图形最优性能的参考。

我们知道,受到图形API版本、游戏优化等条件影响,实际游戏——尤其是很多老游戏,很难达到其基准测试的理论最优性能。不过Arc显卡现在的情况真的比一年多以前好了太多。

 

2k分辨率+画质拉满,3A游戏基本通吃

我们知道Arc系列显卡在发布最初,对基于DirectX 12的新游戏普遍是很友好,也更能发挥性能的。毕竟以Arc显卡推出的时间点,Intel在写驱动时更偏向对新游戏的支持也合情合理。

所以不意外的,首轮对DirectX 12游戏的测试表现出三个不同版本驱动,游戏性能基本一致:

部分游戏的1% low帧测试,刻在文末查看

由于时间关系,我们测试DirectX 12游戏时偷了个懒(也因为穷…)。实际上这些被测游戏里,只有《赛博朋克2077》和《战争机器5》是原生基于DirectX 12开发的;其他游戏都是最早基于DirectX 11开发,后续才加入DirectX 12支持。

除了光追之类的新特性,相比于DX 11,DirectX 12所处的层级更低,也就更利于对硬件资源的利用。原生基于DirectX 12开发的游戏能够更充分地利用新版API的诸多新特性;而对原生基于DirectX 11开发、后来加入DirectX 12支持的游戏来说,游戏公司实际并不会完全重写游戏代码,而仅对其中一部分做出改动;而且开发之初也不会考虑特别面向DirectX 12,效率自然不一样。

不过如果和下文给出的这些游戏的DirectX 11版做对比,仍然很容易发现,DirectX 12有着明确更高的效率。这也算是技术迭代的优越性吧。

从针对DirectX 12游戏的测试不难发现两点。第一,Arc A770在2k分辨率下基本可以畅玩3A游戏;第二,至少在我们测试的游戏里,三版驱动更新对于DirectX 12游戏性能提升并不大——不过本次测试样本量小,从Arc驱动更新日志来看,实际包括《极限竞速》《阿凡达:潘多拉边境》等在内的DX12游戏都有获得过提升。

Arc显卡驱动相对DirectX 12游戏整体来说,帧率最初就是比较理想的,所以整体提升不大也在意料之中。

本次体验无意于测试光线追踪和AI超分技术,所以并没有将这些热门项目纳入考量。其中有关《消逝的光明2:重装上阵》为什么要开启光追做测试,主要是因为这个游戏区分DirectX 11和12两个API版本的方法,就在于是否开启光追。

值得一提的是,实际体验表明持续的驱动更新修复了3490这类早期驱动版本中存在的bug,比如《消逝的光明2》开启光追后,3490驱动会让游戏画面产生不少闪烁的彩块;我们过去的测试也发现早期驱动版本在部分游戏中存在贴图错误和对象显示不全等问题……现在这些问题基本已经不存在了。

 

DX11游戏体验进步很大

这次测试的重头戏其实是DirectX 11游戏。因为Intel去年8月份宣布在Q3’23 Update(31.0.101.4571)驱动更新中,重构了面向DirectX 11的部分。当时Intel说在更新驱动过后,DirectX 11游戏会获得平均19%的帧率提升,流畅度提升20%(1% low帧)。

后续则听闻在4885、5186等多个驱动版本上,更多DirectX 11游戏实现性能跃升——从近期的驱动更新日志来看,针对不同DX11游戏的优化工作还在持续。我们随机选了几个DirectX 11游戏做体验测试,好些是不在Intel的游戏优化列表中的:

不同游戏的性能提升幅度有较大差异。像《纪元1800》这样的游戏,驱动版本迭代带来的性能提升超过了50%;《原神》也有多达25%的性能进化。《文明VI》则很好地表现了游戏驱动更新带来的三级跳,4887相较3490驱动,性能提升18%;而最新的5333又在4887的基础上,让这款游戏的性能提升了25%...

某些游戏表现出的更多是体验层面的提升。比如《全面战争:战争之锤III》,1080p分辨率下,驱动更新带来了大约30%的帧率提升;测试全程的最低帧也从45fps提升到了63fps。这对体验提升的价值是相当大的。

某些游戏的提升在平均帧柱状图上并不能很好地表现出来。如《消逝的光明2》DirectX 11版,1080p画质下,最早版本驱动的最低帧不到60fps,4887驱动将这个值提升到了70fps,而5333驱动又将最小帧率值提至90fps——这个最小值甚至都超过了过去两个版本的平均帧。

另外,如果再回过头去比较某些游戏的DirectX 12版,也很容易发现DX12的优越性。比如《纪元1800》这款游戏的DirectX 12版,在1080p画质下,无论是哪个版本的驱动,Arc A770都能跑到125fps的帧率。而切换回DirectX 11,历史版本的两个驱动,帧率就只有80-90fps;最新版5333驱动才让帧率提到了大约120fps。

再比如《古墓丽影:暗影》,1080p分辨率DirectX 12版的平均帧稳定在115fps,而DirectX 11版即便上了最新驱动,也不到90fps的帧率。看来不光是Intel的软件工程师在加班,游戏公司的工程师们也是有在努力做事的…

 

再回头看看那些老游戏

最后照例还是要看看基于DirectX 9的老游戏。Intel给DirectX 9老游戏提速,或者说全面重构DirectX 9相关部分的驱动是在去年2月份开始,当时的Q1’23 Update驱动更新(4091)终于是让一大堆老游戏在Arc显卡上焕发了新生。

其实老游戏的平均帧率本身不是什么大问题,因为大部分老游戏的图形渲染负载对于现在的显卡来说是小意思。而体验提升更多的应该从帧生成时间的角度去考虑——不过受限于体验时间,我们无法细致到将frametime和GPU busy等相关数据做一一呈现。未来有时间我们再做这方面更为系统的考量。

不出意外的,对于《蝙蝠侠:阿卡姆之城》《武装突袭2:箭头行动》这样的游戏,新版本的驱动切实带来了成倍的平均帧提升;《彩虹六号:围攻》及《半条命2》这样的主视角射击游戏也有40-50%的性能提升。

《英雄联盟》似乎在这一年间多次更新过游戏版本以后,对3490这样的旧版驱动也显得更友好了(似乎以前只能跑200+帧)。而且不知为何,5333新版驱动在跑《英雄联盟》时,2k分辨率下的游戏帧率反倒比1080p分辨率下略高,跑了好多次都如此。这可能与游戏版本,及其缩放策略有关。

另外值得一提的是,《彩虹六号:围攻》是本次测试中唯一一个不仅有DirectX版,而且有Vulkan版的游戏,所以我们也测了其Vulkan版的表现。Vulkan的效率还是显著高于古早的DirectX 9的,所以游戏帧率也明显更高。

尤其3490版驱动时期,DirectX 9版只能跑176fps,Vulkan版就已经能跑将近290fps了,中间API层效率强了62%....毕竟Vulkan也是个低层级的API。看起来Arc驱动更新也带来了Vulkan效率的小幅提升。

最后给出上述某些游戏的1% low帧测试数据,仅供参考。

我们之所以没有对全部测试都做1% low帧统计,一方面是因为游戏内置benchmark的转场会大幅影响到MSI Afterburner这类工具的统计准确性,另一方面是部分老游戏的benchmark流程很短,某些系统层面的性能扰动会致使1% low帧数据准确性受到很大影响。

不过准确的1% low帧本身是基于frametime(而非简单的低帧率取平均)所作的统计,所以对反映游戏体验会更有价值。

就笔者个人来说,现在拿Arc显卡跑全高画质、4k分辨率的《原神》已经比半年前妥当了非常多。去年我们在做A750测试时还提过,可以玩4k原神,但有些勉强……这只是一个例子,这类变化,显然都是驱动更新带来的,尤其是这半年多以来,对DirectX 11游戏的优化。

针对这款Sparkle Arc A770 OC Edition显卡,在不久以后的下篇中,我们还将体验其AI性能表现——这也是AI PC话题大热以来,显卡们绕不过的一个话题了。

责编:Illumi
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 未细看,5k 60hz DP 输出,系统限制状态 35W
  • 这卡待机功耗多少啊
阅读全文,请先
您可能感兴趣
量子计算利用了三种关键量子原理:叠加、纠缠和干涉。这些概念在量子计算机中发挥着根本作用,从而使得量子计算机与传统计算机有很大不同。
尽管有着积极的预测,人工智能半导体领域仍面临持续的挑战,特别是在性能和功效方面。因此需要进一步努力加强和完善设计,使基于人工智能的工作负载能够低功耗执行。
为了克服CPU和GPU的限制,为人工智能推理工作负载专门设计的创新型硬件加速器,可实现高效和优化的处理,同时最大限度地减少能耗。
蔡崇信表示,中国目前与顶尖大型语言模型(LLM)的差距约为两年,但他看好中国的消费市场及人工智能(AI)的发展前景,“中国有能力自主制造高端 GPU 芯片,不一定依赖于英伟达”。
生成式人工智能应用的爆炸式增长,刺激了对人工智能服务器和处理器的需求飙升。目前,这些处理器中的大多采用计算式GPU,如英伟达的GPU。但随着DSP算法的快速发展,DSP是否也能满足AI处理器应用?这些高性能算法是否能够助力DSP取代GPU呢?针对这些问题,且看本文作者的观点分析。
GPU在游戏、专业视觉之类的图形应用之外,还广泛用在通用计算加速、数据中心领域。不过如果追本溯源去看GPU的“初心”,用于图形渲染的GPU又发展到哪儿了呢?它和通用计算乃至AI计算的GPU市场比起来如何?
此次GTC上新推出的用于AI/ML计算或者大模型的B200芯片有一个显著的特点,它与传统的图形渲染GPU大相径庭并与上一代用于AI/ML计算的GPU很不一样。
在现代制造业中,仅依靠制造执行系统(MES)、设备自动化系统(EAP)、高级计划排程系统(APS)、实时派工系统(RTD)等各种管理系统,还远远不够。工程智能(Engineering Intelligence, EI)作为半导体工业软件体系的核心环节,正扮演着越来越重要的角色……
凌华科技EGX-PCIE-A380E 集成了Intel Arc GPU,是一款性能强大且高效的PCIe Gen4独立显卡
支持软件开发团队在虚拟硬件平台上进行固件和MCAL开发
文|萝辑怎么简单直白地评价智己L6呢?蹭个热点吧,就是小米SU7的核心优点它都有,而SU7所有让人难受、别扭的地方,它都解决了。虽然车圈的价格战已经打了好几轮,但是小米SU7的上市,还是可以看成一个重
4月9日,金山办公生产力大会在京举行,现场发布了面向组织和企业的办公新质生产力平台WPS 365,其包含升级的WPS Office、最新发布的WPS AI企业版和WPS协作。WPS 365打通了文档、
约一周前,小米汽车SU7正式上市引起了巨大反响,该车型搭载了SiC功率模块技术在内的多项硬核技术。在全球汽车电动化的浪潮下,碳化硅主驱有望成为了新能源汽车的标配。然而,要充分发挥碳化硅模块需要新的封装
PIC32MK多电机方案之PMSM基于BEMF的FOC反电动势(BEMF)通过滑模观测器估算精简了软件层级,简化了控制流程,明确了数据结构可轻松地独立配置每个电机的控制参数在低速和高速时准确估算转子角
AI、机器人、大健康等产业的爆发,正在深刻改变人类社会发展进程。在这一重大历史变革的关键期,传感器作为纵深应用的基础,亟需拓展新的方向,为新一轮产业升级积聚更多发展动力。随着新的发展趋势不断显现,传感
点击上方蓝字谈思实验室获取更多汽车网络安全资讯4月8日,丰田汽车公司(以下简称“丰田”)与中国五矿集团有限公司(以下简称“中国五矿”)就车载动力电池梯次利用和资源循环业务达成战略合作,并与中国五矿所属
集微网消息,4月8日,泉州南翼国家高新区(厦泉金合作发展区)南安片区“新质南翼·新极未来”发展大会在福建省泉州市源昌凯宾海景大酒店隆重举行。大会由中共南安市委员会、南安市人民政府、泉州半导体高新技术产
插播:6月14日,汽车碳化硅大会即将在上海举办,报名请扫上方二维码随着全球新能源汽车市场的蓬勃发展,比亚迪、宝马近日均宣布了其在电池技术及生产领域的重大进展:比亚迪:一汽弗迪旗下PA75动力总成电池项
此前研究机构预测:当前笔记本电脑整体需求偏弱,品牌缺乏出货动能,因此预计2024年一季度全球笔记本电脑出货季减5.4%,主要原因是中国台湾代工厂一季度整体衰退幅度大于整体市场。但实际根据研究机构IDC
根据TrendForce集邦咨询旗下新能源研究中心2024年4月3日的报价,单晶复投料人民币价格为 RMB54/KG;单晶致密料人民币最新价格掉落至 RMB52/KG,跌幅为 7.14%。N型料人民币