广告

从3080 Ti说起,谈谈游戏GPU的几个热门技术

时间:2021-06-04 作者:黄烨锋 阅读:
英伟达今年在Computex主题演讲中,有关Geforce RTX 3080 Ti/3070 Ti发布所占的篇幅很小,基本上只有5分钟的时间。这两款GPU产品的发布一早就有传言,推出是在情理之中的。从已有媒体发出的测试来看,3080 Ti的性能与3090接近,两者的硬件配置也是比较接近的,可简单认为是3090的显存缩减版……
广告

前两年的英伟达GTC大会,我们都用较多的笔墨描摹了英伟达在AI方面的布局。事实上,虽然数据中心业务在英伟达这家公司的营收占比不断提升(达到将近四成),其最大的业务板块仍然是游戏。英伟达FY21财年营收构成中,游戏仍然有着将近一半的营收占比。

借着这次英伟达在Computex 2021大会上的主题演讲和新产品发布,我们来谈谈英伟达当前游戏相关的热门技术,也算是炒个冷饭——由RTX 3080 Ti/3070 Ti发散地聊聊如今英伟达在游戏GPU方面主推的技术。

英伟达今年在Computex之上的主题演讲并不意外地分成了游戏和AI两大部分,时间各占一半,也表现了游戏和AI(数据中心)作为其营收支柱的重要性。

新发布的Geforce RTX 3080 Ti和3070 Ti

主题演讲中,有关Geforce RTX 3080 Ti/3070 Ti发布所占的篇幅很小,基本上只有5分钟的时间。这两款GPU产品的发布一早就有传言,推出是在情理之中的。从已有媒体发出的测试来看,3080 Ti的性能与3090接近,两者的硬件配置也是比较接近的,可简单认为是3090的显存缩减版。

英伟达宣称RTX 3080 Ti相比2080 Ti提速1.5倍。同样是Ampere安培架构GA102芯片,包括采用第二代RT光追核心、第三代Tensor核心、新的SM实现更高的FP32吞吐等。

从公版显卡形态来看,RTX 3080 Ti和RTX 3080非常相似,仅从配置上能看出规格上的提升,主要表现在VRAM显存和CUDA核心、Tensor/RT核心规模上的变化。所以其整体尺寸与散热设计,和RTX 3090仍然不同(但TDP一样),后者明显在尺寸上更大——这可能给RTX 3080 Ti造成更大的散热压力。

RTX 3070 Ti也属于Ti家族的常规更新,安培架构GA104,对比RTX 2070 Super有1.5倍性能提升。这两款新品对比已有产品的规格具体如下表,老黄的刀法看起来还是相当精湛:

以英伟达显卡两年一更新的常规节奏,今年的30系列的确是相比两年前10系列相当值得更新的GPU了,甚至不只是光追、DLSS等方便新特性的提升。下面这张图是英伟达给出的三代产品Ti家族,在一些游戏上的性能变化。

英伟达国内官网给的参考价格是RTX 3080 Ti为5499元人民币起,RTX 3070 Ti则为3899元起。前者6月3日开售,后者6月10日开售。这个价格真的是看看就好,现在的GPU能不能按照英伟达的市场指导价买到,是个听天由命的事情——即便黄仁勋在采访中已经在反复强调英伟达一方面在推CMP矿卡,缓解显卡供货问题,另一方面则每季度都有供货的稳步提升。

光追与DLSS生态进展

当然本文不是要谈GPU缺芯和矿潮的问题。Ampere架构的两个重要技术就是对实时光线追踪和DLSS的硬件加速。不过这两项特性早在Turing架构时期就已经作为英伟达主推的技术存在了。

现在这个阶段属于英伟达奋力将这两个特性扩充到自家游戏生态中的过程。这两项特性也是AMD这类竞争对手的绝对弱项,只不过AMD如今把持着游戏主机生态,在游戏领域具备了相对特别的话语权。所以英伟达要喊游戏开发商来为这两项特性站台。今年Computex上,英伟达就游戏相关的部分,主要发布的就是扩充了光追和DLSS支持的游戏队伍。

有关光线追踪这项技术,我们已经在此前的文章里多有阐述,这里不再多谈,毕竟英伟达的宣传攻势已经到了消费者即便没见过,也听过无数次的程度。简单来说,光线追踪就是在生成某个3D场景时在某个阶段所采用的一种技术,这种技术能够模拟现实世界中光的行为,让画面的光影效果变得更逼真。Turing架构时期为消费级GPU新增的RT core,就属于为光线追踪加速的专用硬件单元。

Ampere架构的所谓二代RT core,主要应当是硬件资源堆砌更多(或可能有能效提升),在光线/三角形相交性能方面相比前代有2倍提升。

不过实时光追对GPU硬件资源仍有着相当贪婪的需求。当代GPU开4K+光追,畅玩3A大作在很多时候还是颇为勉强的。这时候配套的DLSS就能缓解硬件资源方面的压力。此前我们一直没怎么细致地谈过DLSS技术,趁此机会可以简单介绍一下:

DLSS(Deep Learning Super Sampling),看名字就知道是一种采用深度学习的超采样技术。DLSS在Turing架构GPU中也是引入的一项重要特性。其外显就是把低分辨率的画面升格为更高的分辨率。比如说把1080p的游戏画面升格为2k画面,而2k画面则可升格为4k。这么做的价值在于,GPU不再需要渲染很高分辨率的画面,渲染低分辨率画面后通过DLSS实现分辨率的升格,而且画质与原始高分辨率渲染的画面相差还不大。

去年英伟达将DLSS升级到2.0版本,其工作方式大致上是这样的:用超级计算机,对游戏超高分辨率的画面和(输出的)低分辨率画面映射做训练(AI training);输入也包括了运动向量,应用于高分辨率画面可以预测下一帧。此前有报道说英伟达是用DGX-1服务器做训练的。训练得到的AI模型通过Game Ready Drives和OTA升级推送到用户端。

在开启DLSS特性的游戏里,GPU就应用训练模型,做inference,实现低分辨率画面升格到高分辨率的操作。RTX 20与30系列GPU中的Tensor core,就有加速DLSS的职能,这也是AI在游戏消费端广泛应用的技术了。

从支持DLSS特性的游戏来看,这项技术的主要价值在于极大提升游戏帧率(因为实际要渲染的分辨率变低了),使得光追+DLSS成为相当好的搭配方案。在开启光追与DLSS时,可保持流畅的游戏体验;虽然DLSS升格的游戏画面,和原高分辨率渲染的画面画质相比还是会有差距,但提升已经相当显著。另外,DLSS对于帧率有更高要求的VR理应会有很大的价值。

《DYING: 1983》开启光追效果后的游戏画面

这次的Computex主题演讲中,英伟达主要提到相关光线追踪与DLSS的事件包括:

  • 游戏《DYING: 1983》(中国游戏开发商NEKCOM开发)支持光线追踪+DLSS;
  • 《彩虹六号:围攻》实现对DLSS的支持;
  • 《伊卡洛斯(Icarus)》第一章“First Cohort”将支持RTX光线追踪全局照明和DLSS;
  • 《荒野大镖客:救赎2》将支持DLSS;
  • VR游戏《无人深空(No Man’s Sky)》支持DLSS;
  • 《Wrench》(Steam介绍中提到这是个机械模拟器,以VR的方式维护赛车)支持光追和DLSS;
  • VR游戏《死亡半径(Into the Radius)》支持DLSS;

射击游戏低延迟的强化

不像DLSS/光追那么知名,英伟达有个Nvidia Reflex技术,主要面向的应该是电竞市场。这项特性也是到RTX 30系列显卡推出时才发布的,需要与G-SYNC显示器配合,也支持比较老的GPU;是一项在竞技游戏中,减少系统延迟的技术(click-to-display延迟),让PC和显示器更快地响应鼠标和键盘输入。

Reflex包含两部分,一是Reflex SDK——面向开发者的API,在游戏中加入Reflex,则游戏引擎做到与渲染的实时“对齐”,对于GPU压力比较大的游戏场景有延迟表现方面的提升;

Reflex的另外一个组成部分是Reflex Latency Analyzer延迟分析器,针对厂商集成到G-SYNC显示器中的系统延迟检测工具,可以检测从鼠标点击,到屏幕显示像素变化,这个过程里的时间——这个工具也是为电竞选手或爱好者准备的,以精准理解鼠标、PC和显示性能。

针对系统延迟,英伟达官网有篇文章推荐游戏爱好者阅读,虽然主体上也是在为Reflex打广告,但对延迟的介绍也挺系统。

”英伟达在Computex上提到,平均而言,Reflex可以将系统延迟缩短20ms,20ms可能是开枪有没有射中敌人的关键。“让游戏玩家展现真正的实力”。“游戏玩家喜欢这一技术,超过90%的游戏玩家使用Reflex进行比赛。”

有关Reflex的发布,Computex会上有以下一些组成部分:

  • 《战争雷霆(War Thunder)》《永劫无间(Naraka Bladepoint)》《穿越火线高清(Crossfire HD)》《逃离塔科夫(Escape from Tarkov)》都对Reflex实现了支持,“15大热门设计游戏中,有12款即将采用Nvidia Reflex”;
  • 13家合作伙伴5款显示器和21款鼠标实现对Reflex Latency Analyzer的支持,包括联想、Viewsonic、EVGA;“只需将鼠标插入显示器,就可以精确测算从点击到光子(from click to photon)的端到端延迟”;

游戏笔记本上的Max-Q

英伟达为笔记本设备推的Max-Q技术应该也算是PC游戏界相对知名的技术了。Max-Q是把图形算力不错的独立GPU,塞进相对比较轻薄的笔记本中的技术和方案;也就是说让笔记本既有不错的图形算力,又有比较薄的体态。

Max-Q设计考虑的因素包含芯片、驱动、散热、电气、控制系统等。在面向笔记本的Geforce RTX 30系列GPU发布之时,英伟达也发布了第三代Max-Q技术。Max-Q本身应该算了多种技术的组合,比如说其中有个Dynamic Boost技术。

Dynamic Boost的实质,就是考虑到偏向轻薄的笔记本设计中,GPU和CPU是共享散热和功耗设计的。通常共享散热设计的方案,无法让CPU和GPU同时达到预设的TDP,那么OEM厂商就需要对不同的峰值、持续负载做对应的资源分配。Dynamic Boost 2.0就是一种CPU、GPU和显存做动态功耗分配的技术,在比较轻薄的游戏笔记本上,可能以部分牺牲持续性能的方式,为峰值性能提供足够的空间。

Max-Q设计还包括名为Whisper Mode的方案,最新版本的Whisper Mode是从系统设计层面来控制系统风扇及其产生的噪音——这项技术顾名思义也就是让玩家在游戏性能/画质与更安静的系统之间做出选择,对于很多原本就能实现极高帧率的游戏而言,Whisper Mode还是相当有价值的。

新版的Max-Q现在也有DLSS的加持,另外也包括resizable BAR的支持。随Ampere架构而来的第三代Max-Q,也是因为有了DLSS的加持,算是极大程度实现了性能和功耗表现的双丰收。“假设以47fps的速度玩《控制(Control)》,在1440p分辨率下,GPU渲染的像素接近400万,功率80W;Nvidia DLSS采用AI驱动的Tensor core来提升帧率,GPU只需要渲染一小部分像素,使用AI来补完帧,得到的图像和原生1440p一样精美,相同功率下获得性能是原生图像的1.5-2倍。”

因为笔记本设备在PC中占比的提升,Max-Q技术实际上也是英伟达提升收益相当重要的组成部分(虽然MX系列的入门GPU可能仍然是个主力)。

英伟达这次在Max-Q方面的产品发布,主要是和外星人合作设计的一款RTX 3080笔记本Alienware x15,这款15寸笔记本的厚度为15.9mm。应用的技术包括了前面提到的Dynamic Boost、Whisper Mode和Advanced Optimus(一种独显与核显都可直连输出到屏幕的方案,能够降低功耗)。

当图形计算应用于设计和作品

图形计算除了应用于游戏,在很多领域也有重要的位置,比如说3D设计。英伟达的Nvidia Studio平台就是面向3D设计师、视频剪辑师和摄影师的。Studio的实体包括GPU和“特有驱动技术”(所谓的Sdudio Drivers)的结合。

主要的支持领域包括视频编辑与动态影像,比如Premiere、达芬奇的创作;3D与渲染,如Autodesk Arnold、Blender;摄影师后期编辑,Photoshop、Lightroom是典型;图形设计,如Illustrator;以虚幻引擎、V-Ray实现光线追踪支持的世界模拟等。

对于这个平台,英伟达也向软件开发商提供Studio SDK,在其应用中增加渲染、AI、视频处理特性等。通常RTX Studio系统采用高端Geforce/Quadro RTX显卡,以及高标准要求的显示器,以笔记本或桌面PC的形态呈现。

英伟达在Computex上针对这一平台的发布,主要是宏碁和惠普所推的Studio笔记本电脑。其中惠普Envy适用于学生和创作者,是款偏便携的本子。而宏碁ConceptD除了形态上的翻盖设计外,还带Ezel绘图板。

此外,英伟达这次还提到了Omniverse Machinima。Machinima一般是指使用实时图形引擎去打造电影、短片作品的方式,80年代就有了。此前Quake、Doom引擎就被用来创作电影。《模拟人生》这款游戏,似乎在网上就有很多人用其素材来做成短片或者故事片的。 

英伟达所推的Omniverse Machinima就是为此加了光线追踪和AI,制作动画故事。用户可以导入自己的游戏素材,或者从英伟达的库中提取素材。有关Omniverse,此前我们也介绍过多次了,这是个用于创建、模拟虚拟世界的平台,在虚拟世界中的元素是遵循物理定律的(比如对液体、材料的模拟等)。将其应用于Machinima,本身就是相当顺理成章的需求。英伟达也在其中加入了不少工具,比如Wrench的AI Pose的网络摄像头就能对现实中的动作进行动画处理。

目前Omniverse Machinima发布的是测试版。

其实有关Omniverse,未来我们还可以单独撰文做更多可能性的探讨。今年黄仁勋在线上接受采访时,所处的位置就在英伟达的新建筑内(似乎叫做Voyager)。黄仁勋特别提到这座建筑在设计上是花了比较多的心思的,比如在光照的设计上。

据说这栋建筑在设计之初,英伟达就“在超级计算机DGX上,利用光线追踪对整栋建筑做了模拟,这样的话,我们就能平衡从外界照进来的光和热量了”,所以这栋建筑的房顶在设计上就有个恰到好处的角度,让早晨和下午的阳光都不会直射到房子里。在做到某种自然光的“fine balance”之后,就不需要供许多电用于空调。

黄仁勋说,这是英伟达为建筑所做的贡献,采用超级计算机模拟未来建筑,“我想,未来所有的建筑都会是这样。”另外,在设计思路上,这栋楼内部未来会容纳很多的机器人,在楼内游走。“你可以把自己上传进机器人,用VR/AR头盔做设定,通过机器人在园区内行走。”

不知不觉,还是从单纯的图形计算谈到了AI。从英伟达对模拟世界的种种设想来看,GPU应用于图形计算和AI似乎更像是件共通的事情。Computex上所做的这些都属于生态发布,或者说是生态构建进展的汇报。英伟达正在缔造的图形与AI生态帝国显得如此令人难以望其项背,当前其生态能力很多时候已经让人忘了GPU作为硬件的存在性。

从一家单纯为游戏做加速卡的公司发展至今,应该是近30年前老黄在开创英伟达之初无论如何都没有想到的……吧。

责编:Luffy Liu

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
黄烨锋
欧阳洋葱,编辑、上海记者,专注成像、移动与半导体,热爱理论技术研究。
  • 有效控制汽车电子控制器的静态电流需要做哪些工作? 随着汽车电子控制器在汽车里的数量越来越多,对于汽车电子控制器静态电流的要求也在不断增高。静态电流的控制只有在设计的初期做好整体的架构拓扑设计、器件选型和优化、设计优化以及软件控制策略结合等工作,才可以将静态电流控制在规格书的范围以内。
  • 2020 年全球出货1.51亿智能音箱,近半数采用联发科芯片 在2020年全球出货的1.51亿智能音箱和智能屏中,有近50%都在使用联发科的应用处理器。2020年联发科在智能音箱和屏幕市场的份额增长了六个百分点,过去两年的市场份额增加了一倍多……
  • 究竟是否应该选择授权互联IP?为什么? 我们最大的问题是哪些部分需要我们内部设计,哪些部分可以从外部引入?对于是否选择第三方提供的方案,针对不同IP在这个抉择上的争议程度有所不同。在本文中,我们要采用专为互联任务设计的网络来取代SoC的内部自建总线。
  • 比苹果M1更牛的芯片,明年高通可能要造出来了 苹果M1证明了Arm也能用来造高性能处理器,但并不意味着其他同在Arm阵营的企业有这种能力。和苹果存在直接竞争关系,且同在Arm阵营的,市场表现比较出色的应该就是高通了:无论是在手机处理器,还是在PC处理器上。
  • 低时延无线系统设计时,工程师都会考虑哪些因素? 无线通信网络的设计通常侧重考虑带宽、工作频率和时延等因素。本文将着重介绍实现低时延性能的设计考虑因素,特别是从设备首次接收到信号,到信号到达其最终目的地之间的时间如何实现最小化。
  • 国产CPU的技术研发线路和安全可信生态建设 在今年的IC领袖峰会上,来自天津飞腾的郭御风博士受邀作了题为“算力数智世界,用芯携手未来”的演讲。笔者借此机会专门采访了郭御风博士,并就国产CPU研发现状、技术线路规划和生态建设进行了深入交流。
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。

  • 多家制造商开始采用NVIDIA BlueFie 华硕、戴尔科技、技嘉、云达科技和超微发布采用NVIDIA BlueField-2 DPU的新系统。同时基于NVIDIA GPU的系统也都可以选择添加BlueField-2 DPU,一些应用和客户用例中可能不需要用到GPU,但仍然可以受益于DPU。
  • 全面开启数字化转型之旅 AI对于铁路运输的数字化转型进程至关重要。现下智能传感器的应用和无处不在的网络连接意味着铁路系统正在产生前所未有的庞大数据,与此同时,运营商则需要应对随之而来数据洪流。AI技术将在解锁信息方面发挥愈发重要的角色,为运营商的决策提供具有可行性的洞见,甚至能够自动生成适时的响应。
  • 【爆料】华为P50系列首次亮相!徕卡四摄、极具辨识度 关注国产手机最新消息:昨晚的HarmonyOS 2及华为全场景新品发布会还有一个彩蛋,旗下P50系列首次亮相。不过余承东表示,华为P系列旗舰按惯例在每年春季更新,但由于众所周知的原因,P50系列被推迟
  • 氢能源应用的氢气传感器 氢是一种清洁可再生能源载体,能够为汽车提供动力,而唯一排放物是水,氢燃料电池被确认为新能源车的优选方案。但是,氢气和空气混合时却极易燃,因而需要特别有效的传感器进行监控。探查氢气非常具有挑战性。此类气
  • 麦克斯韦(Maxwell)的遗产 一位微波工程师的心得体会 电子万花筒平台核心服务 中国最活跃的射频微波天线雷达微信技术群电子猎头:帮助电子工程师实现人生价值! 电子元器件:价格比您现有供应商最少降低10%射频微波天线新产品新技术发布平台:
  • 答题赢好礼 | ADI应用之旅——工业大机器健康篇 ▲ 了解更多精彩内容 点击上方蓝字关注我们MEMS传感器技术至关重要:该技术为新型传感器的开发提供了可能,此类传感器体积小巧、性能可靠且能精确测量振动和运动。例如,低噪声、宽带宽加
  • 车企自建的电池工厂和对大电池企业依赖    最近动力电池有很多的新闻,关于国内一线和二线电池企业的:1)宁德时代计划在上海建一座大型电池厂,为特斯拉供应全球一半的动力电池和储能电芯2)长城汽车与宁德时代签署十年长期战略
  • 干货 | 你真的会选TVS二极管吗? ‍‍作为硬件工程师,相信大家都用过TVS二极管,但选择一个合适的,可能并没有那么简单。下面列出了选择合适TVS的几大步骤:1、Vrwm大于等于被保护信号的正常工作电压,Vrwm比被保护信号的工作电压越
  • 【电子技术分享】单片机的复位电路 复位电路又叫做初始化电路,它是的目的是将芯片的工作状态回到我们的初始状态,特别是我们的芯片在工作的过程中出现问题,这时候我们就可以对我们的芯片的内部进行复位处理。单片机的复位可以使用我们专门复位的芯片
  • 【6月10日|直播】从容应对测试挑战,助力实现毫米波的创新 是德科技开放实验室主题日(Application Focus Day)从2012年正式举办以来,是德科技北京/上海/深圳/成都四个实验室为各个地区的用户每年都带来10场以上的技术专题活动。开放实验室主
  • 北上、南下资金最新动向 【6月3日(周四),陆股通、港股通数据及十大成交活跃股,点击可看大图】
  • 【流量计专业群】赶紧加入吧!  【流量计专业群】 为大家提供一个专业的技术型交流平台。作为流量计交流群,本群讨论内容包括但不限于技术方案如何优化、部件选型最佳配置新产品推广、新材料应用行业资讯、产业投资。。。。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了