都说Switch 2里头那颗来自NVIDIA的T239芯片性能拉跨,但实际游戏性能却比采用4nm芯片的掌机还强,真的?……

前不久任天堂宣布Switch 2游戏主机发售4天销量超过350万台,成为历史上销售最快的游戏主机。不知道各位同学对350万这个数字有没有概念,作为对比,Steam Deck作为掌机类别中的佼佼者,全生命周期的销量也不过就是这个量级。

不过有人说Switch 2这次的价格有些离谱:Switch 2美版价格大约450美元,相比初代Switch的确贵了不少;但Steam Deck、ROG Ally之类的掌机,价格可是比这还要高的,即便它们的定位是不同的。毕竟你得看用料啊,Switch 2用的是什么芯片、什么屏幕、多大容量的电池?Steam Deck、ROG Ally之类的竞品用的又是何等配置?

单从电子组件、芯片用料的角度来看,任天堂游戏机的机能始终不及同时代的其他竞争对手。但使用体验却未见得,比如以20Wh的电池容量,更轻更薄的机身,达成相似于竞品两倍电池容量的续航。更重要的是,据说这回老黄给Switch 2定制的芯片,虽然只用了8nm工艺,且架构还停留在上上代的Ampere,却在实际游戏体验方面完全不输已经用上7nm乃至4nm工艺的竞品。

不谈游戏资源,Switch 2相比主流Windows掌机还有价格上的显著优势(虽然游戏价格就完全不是这么回事了)。换句话说,以更低的成本、更拉的芯片,达成了更好的游戏体验,及远高于竞品的销量,怎么做到的?一定程度上,这甚至可以作为,应用导向的设计以及从系统角度着眼,提升性能与效率的典范去谈,即便Switch始终是个明显更专用的游戏机。

 

谈谈Switch 2与T239的性能

极客湾在Switch 2正式发售之前,就已经展示了这颗NVIDIA定制芯片T239的die shot、SEM剖面图,及其制造工艺、构成,乃至它与NV面向边缘设备的同胞兄弟Jetson Orin T234芯片的对比。

虽然任天堂和NVIDIA都没有详细列出这颗芯片的规格信息,但现在我们普遍已经知道了Switch 2里头的这颗T239,CPU部分是8核Cortex-A78C,GPU部分则总共有1536个CUDA核心,GPU整体为Ampere架构——也就是GeForce RTX 30系显卡所用的架构。

恰巧几个月前,我们体验过Jetson Orin Nano Super开发者套装,其中的Orin Nano芯片与T239颇有相似之处,包括同为Cortex-A78AE架构的CPU(只不过是6核),Ampere架构的GPU(只不过是1024 CUDA cores)。

当时我们在测试中说,Jetson Orin Nano的GPU图形性能可能和Intel UHD 770核显(Alder Lake-S的核显)相似。基于T239的CUDA核心数量比Jetson Orin Nano多了大约50%,假定图形性能随CUDA核心数线性提升,则得到的T239图形性能成绩,与极客湾通过模拟测得的性能基本吻合。所以我们认为,极客湾的这份数据还是相当靠谱的:

来源:极客湾

即T239的理论图形性能介于GeForce GTX 750 Ti和RTX 1050 Ti之间;如果和移动端芯片相比,则其底座模式下的图形性能堪堪强于iPhone 16的A18 Pro,弱于面向笔记本的骁龙8 Elite核显;而掌机模式下,其图形性能略强于GTX 750 Ti,弱于Steam Deck的8CU RDNA2。

同时,理论上无论哪种模式,T239的图形性能都弱于AMD Radeon 780M核显(性能低19%-52%),也就是ROG Ally所用的12CU RDNA3;也远弱于Intel面向轻薄本最新的Lunar Lake核显。

所以从绝对图形性能的角度来看,任天堂所谓的“次世代游戏机”,图形性能实则连当代轻薄本的核显都比不上,也比不上Xbox Series S这类上市已经超过5年的家用主机;也就和当代旗舰手机的GPU性能相似。虽说Switch 2的图形性能相比Switch初代的确提升不小,但放在主流图形处理器领域,显然是完全不够看的。

但另一方面,我们近期也大致浏览了不少有关Switch 2的体验视频,发现它的实际游戏性能相比上面的纸面理论性能,看起来要好不少。

 

实际游戏性能,是另一个故事

老黄对游戏机还是有情怀的,前不久他还特别做了个不到3分钟的视频,去谈这颗Switch 2定制芯片。视频本身的信息量不算太大,他只提到Switch 2的这颗芯片带来了几大“突破”,包括硬件光线追踪、支持HDR、向前兼容的架构、专用的AI单元实时强化游戏体验,以及低功耗和高能效。

其实这些主要也都是Ampere架构GPU的特性,且从我们体验过的Jetson Orin Nano Super官方文档来看,T239理论上应该还支持包括ASTC LDR纹理压缩、tiled caching、mesh shader、VRS可变速率着色等在内的各种现代化图形特性。虽然实际就PC玩家的角度来看,这都不算什么新货。

只不过从性能角度看,2025年上市、还在用8nm芯片的Switch 2绝对没什么可吹的——这也符合任天堂近现代做游戏机的风格。但从现有Switch 2上手体验信息来看,Switch 2的实际游戏性能还是出乎我们意料的:尤其连显卡杀手《赛博朋克2077》《霍格沃茨之遗》这样的3A大作都登录Switch 2了。

有关Switch 2能以2k 60fps畅玩《塞尔达传说旷野之息》之类的就不多说了,毕竟任天堂的第一方游戏在其他平台也没什么参考价值。而更具参考性的显然是《赛博朋克2077》。

Digital Foundry已经就这款游戏在Switch 2上的试玩体验做了相当详细的阐述。首先,Switch 2版本的《赛博朋克2077》跑在和PS5相似的贴图纹理质量之上,所以游戏观感层面就显著好于PS4,甚至Xbox Series S的画面;且在DLSS的加持下,画质细节、锐度都更出色。

虽然Switch 2的确也存在一些妥协,比如说游戏画面中的NPC和车辆密度明显不及PS4版,可能与其孱弱的CPU性能有关;阴影渲染也不够真实,比如树木阴影呈现不稳定且更有锯齿感;但总体而言,画质表现都显著优于PS4,接近PS5。

帧率稳定性表现上,无论是30fps的质量档,还是40fps的性能档,任何场景下Switch 2的表现都很稳;仅在《赛博朋克2077:往日之影》的某些场景中,相比Xbox Series S会略吃力。Digital Foundry对于Switch 2版《赛博朋克2077》游戏体验的总评是,CDPR系统技术上的努力卓有成效,是任天堂新主机游戏生态的出色开端。

如果和Steam Deck对比,则在《赛博朋克2077》游戏中,Steam Deck在同为30fps的情况下,画面锯齿严重、远景渲染精度极低,帧数不及掌机模式的Switch 2;据说Switch 2(T239)在该游戏中的画质表现,甚至能超过Radeon 780M(ROG Ally)——后者的性能比前者理论上应该强出1倍不止,功耗也高出1倍以上。

进而在《霍格沃茨之遗》游戏中,Switch 2的游戏画面第一眼观感,也能轻松秒杀另外两款掌机...8nm芯片(T239)干翻4nm芯片(Ryzen Z1 Extreme),惊不惊喜?意不意外?

 

从应用出发的系统设计

大部分关注NVIDIA的读者应该知道,NVIDIA现如今在全系产品及解决方案之上,提升性能的关键已经逐渐从依托芯片制造工艺,转向了系统设计的效率提升。

好比当初宣称GB200 NVL72性能相较前代提升30-40倍,主要就在于系统层面的努力——先别管这个数字有没有水分,单靠芯片制造工艺及设计架构改进,是无论如何都不可能达到这种程度的提升的。

当然在Switch 2这一例中,更多的巧思可能还是来自任天堂,以及专用游戏主机与更通用游戏机之间的差异。从整机系统角度,我们当然还无法系统地去谈Switch 2具备怎样的优势,但毫无疑问T239并不是游戏性能提升的全部。有个比较讨巧的范例:Switch 2终于抛弃了上古eMMC,换用UFS,达成了显著更快的存储性能。

此处的极端就是PS4还在用HDD机械硬盘,所以玩《赛博朋克2077》会经常出现走到NPC面前,NPC的脸都还没加载出来的窘境。PS4在加载所有现代化纹理、几何,乃至碰撞检测与处理逻辑都存在严重滞后......当然这只是一个例子。总之体验提升,应当考虑整个系统。

与此同时,当我们将针对特定应用的“系统性能”扩展到软件,就像Synopsys这两年在谈的SysMoore那样,则纳入Switch 2系统性能考量的,就的确包括了芯片之上的软件全栈。要不老黄说NVIDIA是家软件公司呢?软件可能才是Switch 2有如此表现的关键。

来源:Digital Foundry

很多同学会认为,到这里我们该大谈DLSS超分、帧生成技术了。DLSS作为由AI驱动的超分和帧生成技术,的确是Switch 2能跑3A大作至关重要的一个因素——上面这张表是Digital Foundry给出《赛博朋克2077》在这款游戏机上,四种不同模式下的渲染分辨率及目标帧数,T239能跑到720p/1080p、40fps/30fps,的确要靠DLSS化腐朽为神奇:而且画面效果远好于CDPR原有的TAA时间抗锯齿和AMD FSR2。

GPU渲染一部分像素、AI单元再生成一部分像素和帧,这是图形渲染领域当下的主旋律。电子工程专辑之前也写过不少文章去谈AI技术在图形渲染领域的重要性了,但这不是在以应用为导向、系统性能的软件提升上,本文要谈的重点,即便DLSS的确为Switch 2搭载几年前的芯片却依旧能匹配当下游戏需求提供了极大助力。

有关软件特别适配游戏应用的提升,本来就是游戏主机这类设备的专长:即很多人日常在说的,专芯专用和“专门优化”。从游戏开发者的角度来看,《霍格沃茨之遗》这类在高功耗PC上跑起来都吃力的3A大作,之所以能被搬到Switch 2掌机上,而且以2K分辨率去跑,开发者的专门优化是必不可少的;这也是Steam Deck、ROG Ally这类类PC通用平台很难享受到的待遇。

仔细观察Switch 2上跑的《霍格沃茨之遗》会发现,这游戏的开发商做了不少节约资源、提升效率的努力。比如说相比PC版,除了更少的NPC,游戏画面中的很多模型面数更少(比如桌子),以换取更清晰的纹理和更高的分辨率;不少原本有广阔视野的场景做了收缩——比如为霍格沃茨的走廊加上了窗户,遮挡了开阔视野,则渲染的对象也显著减少了;还有场景切换需要加载地图——比如从建筑推门出去,就不再是PC上那种无缝开放世界了...

还有省略PC版上的诸多物理效果,比如在水里游动时与水的交互效果;VRS可变速率着色、VRR可变刷新率、动态分辨率等都是确保掌机模式下更稳定帧率和体验的技术特性...总体立足人眼需求,把资源用在刀刃上,让玩家不会感觉到严重的画质下降(甚至更清晰的纹理带来了相比其他掌机更好的画面观感),也就提升了效率...

不过这也不是软件层面提升系统性能的全部。包括极客湾针对T239的模拟测试,以及此前我们针对Jetson Orin Nano在内的图形性能测试,都立足于通用图形API(OpenGL, Vulkan)、通用操作系统——如果面向开发者的诸多图形软件中间件也做优化,是不是会更理想?维基百科有页面是特别介绍Nintendo Switch系统软件的,有兴趣的读者可以去看看。

这里着重要谈的是老黄给Switch定制的NVN图形API。图形API对性能有多重要呢?打个比方,此前我们每次PC处理器体验都会测的《彩虹六号:围攻》就同时支持DirectX 9和Vulkan。而选择后者的游戏性能就显著高于前者。这二者还都是通用图形API...

维基百科介绍说这个专用的NVN是个有些“类似Vulkan”的API,“但提供更多如NVIDIA扩展OpenGL兼容的硬件特性”。早在2022年,就有高人(@NWPlayer123)挖到了NVIDIA的泄露数据,其中提到了NVN2。

当时的爆料消息说,NVN2是面向Switch更为强大的图形API,原本是在Switch OLED版上就要问世的。原始推文信息似乎已经不可见,但媒体报道中保留的信息说NVN2就是基于Ampere,支持光线追踪和DLSS 2.2——尤其泄露代码出现了包括nvndlss.cpp, nvn_dlss.cpp等内容。

后续还有更多媒体爆料提到了NVN2,宣称其新特性支持还包括VRS, mesh shader, sampler feedback, 虚拟资源等。不过NVN及更多中间件、操作系统组成等是Switch这个闭源系统的构成,有关NVN/NVN2效率究竟有多高的的问题仍是没有答案的。但通常我们倾向于认为,既然牺牲了通用性,更专用,且在全栈所处层级更靠近硬件,那么跑游戏的效率自然应该会更高。

所以我们也倾向于认为,包括专用驱动、NVN2在内的整个软件栈,都是Switch 2能够跑出比芯片堆料更多、工艺更先进的游戏掌机更出色游戏体验的关键——这也是专用平台的好处了,即便其中可能还涉及到生态构建的问题。

当然了,毕竟是8nm的老芯片了,在没有专项优化、开发者也不怎么积极的情况下,Switch 2相较ROG Ally这种力大砖飞的掌机还是有性能上的差距的。比如据说同样跑《双影奇境》,前者的帧率就比后者低了至多20fps。但这也进一步加强了认知:针对特定应用,着眼系统层面的设计优化,都有助于最终产品达成更低的成本、更高的效率,和更出色的体验。

这样看来,Switch 2是不是也挺符合当代设计思路的?即便这原本就是游戏主机区别于通用平台的关键——毕竟前些年,还有不少媒体撰文认定,游戏主机走向通用是必然,现在看来这可能是个涉及到更多变量、更复杂的问题。

老黄在谈Switch 2定制芯片的3分钟视频里有句话是这么说的:“我们重新思考了整个堆栈,芯片架构、操作系统、API、游戏引擎...”这句话还是相当NVIDIA基因的,也格外适配摩尔定律、电子科技发展步伐趋缓的时代特征,即便或许Switch 2的思路并不适用于所有游戏机。

责编:Illumi
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
从深层逻辑来看,美国限制东南亚的根本目的是要封堵中国供应链迂回路径,也将进一步推动全球半导体产业链形成“中美双核心+区域藩篱”格局。
此次收购是英伟达在AI领域人才争夺战的一部分,此前英伟达已收购了多家AI初创公司,如Deci、OctoAI和Run:ai,并从这些公司中引入了多位核心人才。
这项交易若未通过,可能成为继英伟达-Arm后,又一桩被地缘政治阻断的半导体并购。
未来,英特尔能否通过14A工艺赢得大客户的订单,并在AI和数据中心市场与英伟达等竞争对手抗衡,将是其战略调整成功与否的关键。
CEO布莱克坦言“大部分资金尚未到账”, 已到账资金中,政府补贴占比达45%,股权融资仅占30%,其余为项目合作拨款——现金流压力成为加速出售的直接诱因。
在这一天,A 股 IPO 受理数量达 41 家,其中北交所 32 家、上交所科创板 5 家、深交所 4 家,创下2025年单日受理最高纪录。
当传统生产工艺与智能数据采集相结合时,AI 与全维度数字孪生技术将成为实现下一代数据驱动型制造的核心推动力。
能量收集并不是一个时兴的名词,但是物联网技术的进步以及诸如Silicon Labs的物联网产品以及开发套件,使能量收集技术的应用也变得更加的实际和广阔。
人工智能(AI)已不再仅仅是一项高性能计算任务,它已成为推动边缘AI片上系统(SoC)设计的主要动力。从智能手机和摄像头,到工业自动化与自动驾驶汽车,AI正在日益塑造现代SoC的架构。这
用于电动汽车供电网络(PDN)的高压母线转换器 48 V电源模块
今日光电  有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光引未来...欢迎来到今日光电!----追光逐电 光引未来----▼转发本通
《中国电化学储能产业传感器发展蓝皮书》(下文简称“蓝皮书”)是我国唯一一部专业和系统化梳理传感器产品技术在电化学储能领域应用和发展的蓝皮书。本书由中国传感器与物联网产业联盟主导编写,汇集了一批储能产业
简易的电池电量指示,功耗低,节省空间,无需MCU。无MCU的简易电池电量指示S-82F9/82D9系列可以点亮5个或4个LED,并监控电压,以提供简单的剩余电池电量显示。将多个电压监控功能集成到单个
点击上方蓝字谈思实验室获取更多汽车网络安全资讯在智能化时代,汽车功能呈现爆发式增长,汽车软件的复杂度也指数级增长,据统计,当前一辆具备 L2++ 智能辅助驾驶的汽车, 纯软件代码量就超过了 1 亿行,
前段时间宋佳二封白玉兰女主角的新闻冲上热搜,我上网搜索,本来只是想了解一下女神的过往经历,点开她的百科,却发现这个页面跟从前大不一样。以前都是以文字为主,出生日期、生平履历、作品列表等简历式陈列。而宋
  一、引言   软体机器人因其高度的柔韧性和适应性,在医疗、救援、工业等领域展现出巨大潜力。与传统刚性机器人相比,软体机器人能够更好地适应复杂环境
综合来源:国海证券、东北证券、东吴证券、国信证券等,谢谢汽车传感器是把非电信号转换成电信号并向汽车传递各种工况信息的装置。在自动驾驶的层级结构中,汽车传感器处于感知层,产品附加值高, 是实现单车智能驾
本文来源:智能通信定位圈去年年底,蓝牙技术联盟(SIG)宣布推出蓝牙6.0版本,引入了一项名为蓝牙信道探测(Channel Sounding,CS)的新功能。该功能通过精确计算两个设备之间的距离,实现
限时狂欢:7月9日 - 7月18日这个暑假,不虚度!凡亿教育开启【暑假技能充电季】超级活动——降价+赠礼+满减券,助你技能满格,职场领先一步!凡亿教育暑期专属福利正式开启!福利1:满减神券,立减更划算
(广告分割线)美国对等关税政策即将出炉细节与后续,台湾电路板协会(TPCA)理事长暨燿华董事长张元铭7月7日受访时强调,这项政策对景气影响很大,从产业来看,目前第3季初步看来仍是旺季,预期低轨卫星、服