极致性价比!Intel二代独立显卡正式发布:性能飙升12.5倍

原创 硬件世界 2024-12-03 23:51

Intel今天正式发布了代号Battlemage的第二代锐炫B系列显卡,首发两型号锐炫B580、B570,而此时距离第一代A系列最初登场已经两年多了。

两款新品定位主流市场,主要面向2K超高画质游戏玩家,大致对标NVIDIA RTX 4060系列、AMD RX 7600系列。

因为根据Intel提供的数据,1080p在游戏玩家中的占比逐年递减,如今已经降至56%,2K分辨率则增长到了22%,预计到2026年即可实现反超。

这一代,Intel主打三个亮点:最佳性价比、XeSS 2、AI加速。我们会逐一和大家介绍。

新的Xe2架构在前代Xe基础上进行大量的优化改进,尤其是投入了大量精力对架构的兼容性和软件开销进行重构和优化。

Xe2不仅进一步提升了软件的适配性,还增强了架构的效率,提高了资源利用率,特别是减轻了软件对硬件的开销。

先来看一下两款新卡的公版规格,后边再讲架构和技术。

锐炫B580配备了20个新一代Xe2核心(分为5个切片),对比上代A580反而少了4个核心与1个切片,同时有20个光追单元、160个XXM AI引擎。

不过,核心频率从1700MHz大幅提高到2670MHz,弥补了核心数量的不足,INT8算力性能从197 TOPS来到了233 TOPS,提升幅度约18%。

显存位宽从256-bit降至192-bit,但是容量从8GB GDDR6扩大到12GB GDDR6,等效频率也从16GHz提高到19GHz,因此带宽从512GB/s略微降至456GB/s

整卡功耗190W,只增加了区区5W,从而大大提高了能效比,只需单个8针供电。

锐炫B570做了一部分精简,配备18个Xe2核心、18个光追单元、144个XMX引擎,核心频率略降至2500MHz,INT8算力性能203 TOPS。

搭配160-bit 10GB GDDR6显存,等效频率依然是19GHz,带宽380GB/s,整卡功耗仅为150W。

系统总线接口很遗憾并不是PCIe 5.0,而且从PCIe 4.0 x16砍半为PCIe 4.0 x8,当然对这种级别的卡来说影响可以忽略不计。

硬件解码支持AV1、HEVC(H.265)、AVC(H.264)、VP9、XAVC-H,但是不支持更新的VVC(H.266)。

视频输出支持HDMI 2.1、DisplayPort 2.1 UHBR 13.5——上代是DP 2.0 UHBR 10。

官方宣称,锐炫B580对比定位更高的锐炫A750,平均性能提升幅度可达24%。

特别是打开XeSS之后,提升更加明显,《堡垒之夜》甚至可达78%,《刺客信条:幻景》也能有56%。

对比竞品RTX 4060,平均领先幅度为10%,考虑到种种因素,可以大致视为二者基本在同一档次,和RX 7600也基本差不多。

没有达到之前预期的RTX 4060 Ti的水平,有点小遗憾。

不过无论对比RTX 4060还是RX 7600,锐炫B580的一个显著优势就是显存多了一半,在游戏中更不容易爆显存,运行AI负载时也更有余力。

这一次,Intel依然打造了官方公版,也就是限量版。

仍旧是双风扇、双插槽、黑色风格,重点优化了散热设计,背面有一半都做了散热格栅,风流更大,噪音也更低。

首批合作伙伴除了老朋友宏碁、华擎、蓝戟、旌宇,还新增了两家,一是常年主打高性价比的铭瑄,二是新的傲世创科(Onix)。

各品牌普遍都做了双风扇、三风扇两种设计,除了宏碁暂时只有一款双风扇,傲世创科则都是双风扇。

锐炫B580显卡将于12月13日正式上市(12日晚评测解禁),定价249美元起。

要知道,锐炫A750两年多前首发的时候,还是要289美元。

锐炫B570显卡则要等到明年1月16日才会开卖,定价219美元起。


其实,Lunar Lake即酷睿Ultra 200V系列处理器中已经率先应用Xe2架构的核显,也就是锐炫140V、锐炫130V,如今终于来到了桌面独立显卡,未来还会陆续进入笔记本独立显卡、车载方案、嵌入式方案等。

Intel表示,Xe2架构相对于初代,重点就是提升各方面的效率,包括更高的利用率、更好的负载分配、更好的软件开销等等。

同时,Xe架构诞生两年多来,Intel一直在努力完善驱动、游戏的生态支持,先后迭代了50多个版本的驱动,新游戏0日支持超过120款,游戏适配优化数量也比当初增加了2.5倍。

这就是Xe2的整体架构图,主体依然是渲染切片,这是整个SoC芯片的基本结构,配合指令前端、二级缓存构成一个整体,和第一代如出一辙,基本没啥变化。

每个渲染切片内包含4个Xe核心(计算引擎)、4个光追单元,以及4个采样器、几何单元、光栅单元、HiZ单元(层次Z)、两个像素后端等模块。

各个部分的具体变化,下边拆开来讲。

二代Xe2核心除了继续原生支持SIMD16指令,还增加了对SIMD32的支持,虽然不是原生,但执行SIMD32指令是没问题的,从而能够更好地分配计算资源,还支持64位原子操作。

每个Xe核心内部,包含8个512位的矢量引擎(XVE)、8个2048位的XMX引擎,比上代减少了足足一半,可能调度效率会更高、更灵活。

这一次,Intel为每个Xe核心加入了多达256KB容量的一级缓存、本地共享缓存(SLM),大大减轻了对二级缓存的依赖。

XVE矢量引擎除了支持SIMD16/SIMD32,还支持矩阵扩展,包括INT2、INT4、INT8、FP16、BF16、TF32等数据类型,其中TF32是针对AI优化的数据格式还扩展了Math、FP64支持。

另外,它还支持三路并发,包括FP、INT/EM、XMX,指令调度和执行效率更高。

对比初代,XVE引擎现在更小巧(基本可以视为砍半),应该也会更灵活。

光追部分,Intel也做了大刀阔斧地改进,整体结构没太大变化,但是规模和性能高得多,比如遍历流水线从2条增至3条、方盒相交增大1.5倍、三角形相交增大2倍、BVH(包围盒层次结构)缓存增大2倍来到16KB。

这样的规模当然远远没法和NVIDIA相比,甚至不如AMD,但提升也是相当明显的,应该能够达到基本可用的水平,当然更有赖于游戏的适配和优化。

媒体引擎包含两个相同的多媒体解码器(MFX),但注意它和Lunar Lake里集成的核显媒体引擎略有不同,没有XMX硬件编解码单元,因此不支持VVC(H.266)硬解码。

这就是BMG-G21,二代锐炫显卡首发的GPU核心芯片。

它总共有5个渲染切片、20个Xe2核心、20个光追单元、160个XMX引擎、20个纹理采样器、10个像素后端,以及2个多格式X编解码器,还有多达18MB二级缓存、192位显存。

各家的GPU架构设计不同,所以核心规模不具备直接可比性,但如果将这些与NVIDIA GPU类比,那就相当于80个ROP光栅单元、160个TMU纹理单元。

这是因为,纹理采样器转换为TMU的比例是1:8,像素后端与ROP的转换比例同样是1:8。

按照Intel的首发,经过优化的第二代Xe核心,性能提高了70%,能效提高了50%

而在一组微基准测试中,性能提升幅度最高可达惊人的12.5倍。

比如在《堡垒之夜》中,上图白线代表锐炫A系列,蓝线代表锐炫B系列,单位是毫秒,时间则越短越好。

锐炫A系列执行一帧渲染的时间为19.33毫秒,锐炫B系列则缩短到了13.01毫秒。

关键是,每一个渲染环节的效率都更高了,比如直接执行节省了1.1毫秒,间接执行节省了1.5毫秒等。

这也就证明,锐炫B系列的每一个地方都做了微架构优化,都可以节省渲染时间,从而提升渲染效率和性能。


随着图形技术的进步,单纯的渲染已经不足以反应GPU计算能力,也无法做到显著提升性能,AI渲染就越来越普遍。

XeSS就是Intel打造的AI超分解决方案,对标NVIDIA DLSS、AMD FSR,在较低分辨率的画面帧的基础上,提取运动矢量,使用超分辨率技术进行放大和加速,从而生成更高质量的图像。

官方号称,在2K超高画质游戏中,XeSS可以带来22-80%的性能提升,尤其是在光追等像素生成较为困难的场景中效果更明显。

经过不断努力,Intel XeSS已经有超过150款游戏支持,初具规模。

如今,XeSS终于升级为第二代,SR超分技术基础上增加了两项新技术:XeSS FG帧生成技术,提升画面质量与帧率;XeLL低延迟技术,提升响应速度。

XeSS FG帧生成技术的工作原理是:首先使用游戏引擎,原生渲染出第一帧和第二帧,然后通过插帧技术和AI算法,生成二者之间的中间帧并插入。

为了实现这一目标,Intel采用了两种技术,分别是光流重投影技术、运动矢量重投影技术,二者结合以确保插帧的准确性、画面的流畅性。

不过不同于NVIDIA RTX 40系列,Intel不需要单独的光流加速器硬件,至于是否支持NVIDIA、AMD的显卡还在评估。

目前暂时还没有支持XeSS FG帧生成的游戏,毕竟刚刚宣布,但是《F1 24》等游戏已经在积极开发集成,UE等游戏引擎也可以通过插件支持。

当然,XeSS SR超分、XeSS FG帧生成两项技术也是可以一起使用的。

XeSS SR渲染一个稍低分辨率的画面帧,并将它放大,在送到XeSS FG插帧里,实现帧率翻倍。

比如《F1 24》,可以看到XeSS 2的性能提升是非常显著的,远超初代XeSS。

2K超高画质下,锐炫B580的基准帧率为48FPS,开启XeSS 2质量模式就能提升至2.8倍,不但比初代XeSS高了超过65%,甚至超过了XeSS SR超高性能模式。

依次开启XeSS 2平衡模式、性能模式、超高性能模式,帧率还可以逐步提升,最终高达186FPS,是原生性能的几乎4倍。

介绍XeLL低延迟技术之前,先回顾一下PC游戏中的系统延迟怎么来的。

这个过程始于玩家点击鼠标的动作,一直持续到画面最终显示在屏幕上,这个过程所需要的时间,就是我们说的延迟。

具体来说,玩家操作的信号首先传递给CPU,随后进入一个称作渲染队列的环节,然后GPU将这些指令转换成屏幕上的像素,最后这些像素构成的图像呈现在显示器上。

整个流程中的每一步都可能增加延迟,累积起来就是我们在游戏中感受到的卡顿现象。

为了尽可能降低延迟,NVIDIA打造了Reflex技术,AMD则推出了两代Anti-Lag,现在轮到了Intel XeLL。

XeLL重点针对CPU渲染队列等待过程,基本消除了它,从而大大缩短了从鼠标点击到屏幕显示的整个过程。

Intel PresentMon工具已经可以显示具体延迟,方便玩家测量从鼠标输入到系统显示的整个延迟时间。

同时,Intel内部还开发了延迟测量工具(LMT),基于微控制器的一款特殊设备。

实际性能如何呢?还是以《F1 24》为例。

原生渲染时,48FPS帧率的延迟是57毫秒,而在开启XeLL之后,延迟降低到了32毫秒,改善了多达45%。

更神奇的是,如果把XeSS SR、FG、XeLL低延迟全部打开,可以把延迟降至28毫秒,改善51%,同时帧率高达152FPS,提升2.17倍。

当然,也可以只开启SR、低延迟,此时延迟仅有19ms,改善足有67%,而帧率为90FPS,仍有原生渲染的接近2倍。

XeLL低延迟技术是基于驱动程序实现的,因此效果不是最好的,但很容易集成到游戏中。

首发支持的有《F1 24》、《漫威暗夜之子》、《刺客信条:幻景》等等,未来还会有更多加入。


AI,尤其是生成式AI,是如今GPU绕不开的话题,锐炫B系列也通过增强的XMX引擎,提供了更好的支持。

锐炫B580对比RTX 4060,运行常见的Llama 2、Llama 3.1、Mistral、Phi-3等大型语言模型,都有相当大的性能优势,最多领先约50%。

Intel之前还推出了一个免费的生成式AI工具AI Playground 2.0专为Xe2架构而来(包括核显)。

它允许用户在本地端侧体验图像创建、编辑、AI对话等,下载模型即可体验,无需连接云端。

好的显卡,除了好的硬件架构技术,更离不开好的驱动,Intel也在持续完善,功能不断丰富,无论是图形设置、3D设置,还是超频,该有的都有。

说到超频,锐炫B系列当然也可以,而且更简单,在驱动中开启高级模式即可操作。

上图中,浅蓝色显示的是默认频率和电压曲线,玩家可以向上推动该曲线,从而提升频率,获得更高的性能。

玩家还可以使用电压偏移来改变电压,并访问更多电压点,这一切都实时可见。

电压、功耗都可以设置一定的最高阈值,确保安全超频。

以锐炫B580为例,默认状态下即可轻松超频200MHz;增加20%功耗可以再超200MHz;继续增加25%电压还能继续超200MHz。

当然,具体超频幅度和电压、功耗设置,取决于显卡的不同个体体质,以及散热等外部因素。

最后附上官方图赏:


硬件世界 共同研究探讨硬件知识及相关信息
评论
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 131浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 530浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 201浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 125浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 187浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 68浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 76浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 105浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 167浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 202浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 162浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 82浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦