今年年头的CES随Intel和英伟达产品的轮番发布,还真有点儿2023新年PC风向标的意思。英伟达在CES 2023之上发布了面向笔记本的40系显卡。与其说由于这次更新,今年的笔记本产品可能会和往年不同;倒不如说AI正在深刻变革这个时代,并且深入到每个人生活的方方面面。

今年年头的CES随Intel和英伟达产品的轮番发布,还真有点儿2023新年PC风向标的意思——全年的电脑CPU、GPU重要产品都相继问世了。

既然是消费电子向的展览,英伟达在CES 2023之上公开新技术的主要方向还是PC显卡、图形技术及周边生态——Special Address主题演讲有一半的篇幅都给了GeForce显卡和游戏。其实Omniverse、汽车、机器人也都算是发布重点,后续我们也会对汽车相关发布做更详细的报道。

本篇就谈谈英伟达新年面向消费市场的图形产品及技术更新,这部分的发布主要包括:

  • 面向台式机的显卡新品GeForce RTX 4070 Ti;
  • 面向笔记本的40系(Ada Lovelace架构)显卡新品,涵盖GeForce RTX 4050、4060、4070、4080、4090;
  • 面向笔记本的第五代Max-Q技术;
  • DLSS 3游戏生态扩展情况;

其实跟游戏及个人生活密切相关的发布,还涵盖了GeForce NOW云游戏平台的一些重要内容,只不过严格意义上并不算消费向——而且暂时跟我们关系也不算大。除了GeForce NOW游戏与网络扩展,这部分的发布还包括:

  • 发布RTX 4080 SuperPOD for GeForce NOW——也就是GeForce NOW云游戏的基础设施更新,每个用户可分配到64TFLOPS算力,英伟达说达到了Xbox Series X的5倍;
  • GeForce NOW新增NVIDIA Reflex支持,面向云上竞技类游戏玩家;
  • RTX 4080加入GeForce NOW Ultimate Membership会员计划;
  • 汽车开始引入GeForce NOW,首批合作企业包括比亚迪、现代、极星。

 

聊聊2023年的高性能笔记本

有关面向台式机的GeForce RTX 4070 Ti显卡更新,这里不多赘述——RTX 4070 Ti是性能与上代旗舰GeForce RTX 3090 Ti性能差不多的显卡,网上已有的报道不少——对这一代Ada Lovelace架构感兴趣的同学,可以去看看去年我写的剖析文章

不过此前英伟达对GeForce RTX 4070 Ti的宣传有个亮点,就是在达到类似RTX 3090 Ti性能水平的同时,功耗从450W降低到了285W。毕竟这代40系显卡不仅更新了Ada Lovelace新架构,而且工艺也换用了TSMC 定制4N。这次英伟达对于RTX 4070 Ti的性能和效率提升表述是这样的:相比于RTX 3090 Ti,在DLSS 3的加持下,RTX 4070 Ti在不少游戏中达成了1.8倍的性能提升,同时只需要将近一半的功耗。

当然450W÷2的GPU功耗水平仍然无法放进笔记本里,这是笔记本平台需要单独做GPU产品线的原因。对笔记本这种功耗半敏感型、有便携性要求的设备而言,系统设计的一大关键,就是GPU的效率水平。这其实也是阻碍轻薄本乃至部分全能本应用高性能GPU的关键。

英伟达在CES上说,笔记本平台这一代的Ada Lovelace显卡相比上一代,功耗降低了2/3。比如RTX 3070 Laptop原本需要120W的功耗达成的性能水平,这代架构只需要40W。这听起来就相当诱人了——不过猜测应该是算上了DLSS 3这类技术。因为以当代GPU芯片制造工艺和设计水平的单纯进化,是很难达成这么大跨步的效率改进的。

英伟达称GeForce RTX 40系笔记本GPU,达成了有史以来最大幅度的能效进步(3倍)。结合Intel这边13代酷睿处理器(Raptor Lake-S)此前提到只需要25%的功耗就达成接近12代酷睿性能水平的宣传,今年的高性能笔记本——包括游戏本、设计本、移动工作站之类的设备形态,应该会相当有看点。

如果单纯看性能,上面这张图是英伟达给出的RTX 40系显卡,相比上一代Ampere架构30系显卡,在不同游戏中的性能提升幅度。如果加上DLSS 3补帧方案,《赛博朋克2077》这种游戏的帧率提升能有最高4倍,虽然这张图也是完全没有给任何具体产品和画质设定信息。

比较让人印象深刻的是,英伟达在主题演讲中说:“受益于RTX 40系产品,14英寸笔记本能够做到以前绝对无法完成的工作,比如在Blender中的超快速3D渲染、比如Adobe Photoshop或Premiere Pro之类应用的AI工具使用等。”英伟达在PPT中标称这些设计类应用性能提升是2022主流笔记本的20倍——虽然不知道这20倍具体是怎么算的。

英伟达提到一点,说这代Ada Lovelace笔记本的性能可以达到PlayStation 5游戏机的两倍,但尺寸却仅有其1/6。惊叹于技术进步之余,还是不忘默默暗讽了隔壁A卡一把的。

以上是本次发布的面向笔记本平台的从RTX 4090到RTX 4050的GPU大略规格。其实光看这些也看不出个啥。从国外媒体给出的信息来看GeForce RTX 4090 Laptop显卡的die部分是AD103——和桌面RTX 4080一样。从上表来看,4090 Laptop用了AD103 die的一部分。其单精度算力和桌面级RTX 4070 Ti可能是差不多的水平——还是比RTX 3080 Ti Laptop有不小性能提升的。

英伟达也在会上宣布了部分确定的RTX 40系笔记本新品。其一是华硕ZenBook Pro 14,会有RTX 4070、4060、4050不同档可选;功耗是上代GPU的1/3;标称渲染性能,上代原本需要2.5小时的渲染工作,这一代据说只需要10分钟;999美元起售,2月底开售。

还有外星人Alienware x16,搭配的是RTX 4090或4080。这款本子在宣传上是玩4K游戏,以4K分辨率做AV1编码的游戏直播,以及以4K分辨率在Omniverse里做3D设计的。从Alienware这种本子的新发布,还是可以看到近些年笔记本性能的飞速发展。(顺带一提,今年Nvidia Broadcast更新中提到了一项RTX Video Super Resolution超分特性,是用AI来给网络视频流做超分,RTX客户端把1080p视频超分为4k;这个技术应该是可以做搭配的)

当然这两款笔记本只是代表,英伟达在会上给出了各OEM厂商的12款设计。这些都可以作为新一年GeForce笔记本的标版去看。今年的确可以期待一下笔记本设备的性能和效率提升——CPU和GPU同时的。

 

有关笔记本上的Max-Q

虽说PC市场目前还在下滑通道上,英伟达对笔记本市场似乎还是相当看好,他们给出的数据是去年1300万台14英寸笔记本售出,是2020年的2倍之多。“其中的95%都只能做基础的生产力工作。”也就是说,RTX显卡在笔记本市场上还有很大的渗透空间。如果RTX显卡能够以更低的功耗和尺寸塞进笔记本,则这个市场的增长潜力还十分巨大。

英伟达在笔记本上推Max-Q技术好些年了——Max-Q这个词在英伟达的定义里就指代速度快、轻薄、安静、高能效的笔记本。我们此前撰文谈过其中的部分技术:Max-Q本身是需要OEM厂商做系统设计配合的。

随Ada Lovelace架构的问世,Max-Q已经发展到了第五代。这一代Max-Q相比第四代主体上多了4个要点。首先是DLSS 3——也就是此前英伟达发布的AI超分+补帧技术方案,后文会对此做简单扩展;第二是超低电压GDDR6显存——英伟达说是跟内存制造商合作达成的方案;

其三是所谓的三段速控制(tri-speed memory control),“让GPU显存能够动态切换到全新的、更低功耗状态”。这主要相关的好像是一种更细粒度的内存控制方案,毕竟这年头的图形渲染算力密集型应用中,单显存功耗已经高到令人震惊的程度;

最后是Ada架构的片上存储优化。虽然具体不知道是怎么优化的,不过英伟达说这项举措达成了带宽翻番、容量增加16倍、提升了时钟门控。估计说的是L2 cache。

Max-Q的其他历史技术就不多着墨了,比如说Whisper Mode(控制风扇产生的噪音)、Battery Boost(基于AI实时优化GPU与CPU功耗用度、电池使用、画面质量、帧率等)、Dynamic Boost(CPU与GPU功耗动态管理)、Advanced Optimus(独显与核显连接切换)等,都属于功耗、噪音、性能等各方面做权衡的方案,也都包含在其中。

英伟达说在过去6年间,Max-Q达成了效率方面22倍的提升,也不知道具体是怎么算的。从英伟达给出的曲线图来看,第四代和第五代Max-Q的效率提升最为陡峭。就我们的理解,近两代效率提升的主要贡献来源都是AI技术:Battery Boost 2.0就是第四代引入的;而第五代Max-Q的DLSS 3本身也是AI技术的持续应用。

DLSS 3之中引入的AI补帧,或者说藉由Tensor core在渲染管线之后生成帧,应该是达成这一代GPU节能的重要组成部分。不过DLSS这样的技术,要在GPU世界真正达成英伟达理想中的效率提升,生态的铺开仍然是基础。

 

图形渲染算力之外的AI

英伟达DLSS最初是一种AI超分技术,也就是藉由AI技术和专门的AI加速单元,将原本低分辨率的游戏画面超分为高分辨率。AI超分是这两年的大热门,另一边的移动GPU厂商也在做这方面的技术

第三代DLSS是在画面分辨率upscale之外,新增了一种AI插帧(frame generation)方案——且因为AI插帧流程位于渲染之后,这本质上属于CV技术,则反映到需要源源不断、实时输出帧的游戏中,就有概率显著增加延迟——所以DLSS 3把NVIDIA Reflex降低延迟的技术方案加了进来。

有关DLSS 3如何补帧,以及Ada Lovelace架构为此新增专用硬件单元之类的问题并不是本文要探讨的重点,我在此前的文章里有过比较详细的解释,有兴趣的同学可移步了解。从去年GTC上英伟达的演示来看,DLSS 3对于游戏插帧及缩短延迟的效果还是相当不错。

基于AI技术来摸到传统图形渲染单元堆料难以达成的高度,似乎也是现在摩尔定律放缓时代的主旋律。玩个游戏,有一半的帧、70%的像素不再是渲染出来的,而是“凭空”生成的,这件事情想想还是非常不可思议。不过效率提升与功耗降低是实打实的。

实际上此前英伟达宣传中提及Ada Lovelace架构显卡综合性能提升4倍,以及这次说笔记本显卡效率提升3倍,其中都需要DLSS 3或者说AI的参与。这件事情本身是需要行业和用户转变思路的:似乎到目前为止,仍有不少人认为对GPU而言,图形单元浮点算力提升才是实打实的;AI生成的那些东西都不能算升级。

须知Tensor core本身也是晶体管构建的,上层也需要各种中间件、库和其他软件方面的努力,自下而上的各环节打通难度并不比当年图形生态搭建过程简单。而且AI原本就是各行各业的发展未来。只要的的确确提升了体验,就应当将其视作行业技术发展正轨的一部分。

不过DLSS技术是否真正达成了“4倍”、“3倍”的提升,还是要看这个技术的普及程度如何。因为作为一种加速器,并不是开发者想让它加速,它就凭空给程序做加速的:DLSS要求开发生态接入。尤其这次的DLSS 3还新增了Reflex模块。所以英伟达现如今在任何活动上都不忘宣传DLSS生态的发展情况。

好在英伟达GPU的市场容量够大,这方面的基础还不错。英伟达在CES上说,目前接入DLSS的游戏和应用已经超过了250款。“开发者采用DLSS 3技术的速度,比以往任何英伟达技术的采用速度都要快,现有50款已经发布或很快就要发布的DLSS 3游戏。”DLSS 3的发布是去年9月份的事情,其后续发展还是值得做重点观察的:毕竟“4倍”和“3倍”的福利需要生态助力。

这次活动的主题演讲前半部分,英伟达给了挺多DLSS 3新游戏的宣传和演示——当然顺带也在宣传自家光追生态。这些即将发布或将加入DLSS 3技术支持的游戏包括《巫火(Witchfire)》《浩劫前夕(The Day Before)》《Warhaven》《王权与自由(Throne and Liberty)》《原子之心(Atomic Heart)》等。

期待2023年会有更多游戏接入到DLSS或者同类生态吧——人类要在游戏、3D设计方面完成接下来这个属于AI技术的性能跨越,并让大众接受其作为事实上的标准,仍然是需要时间的。

事实上DLSS 3的应用并不限于游戏这类应用,隔壁Omniverse生态也在积极宣传DLSS 3——即便开着光追做设计,也能借着AI技术来达成4K分辨率的画面品质。这对Omniverse或者未来的元宇宙而言,应该也都是一大吸引力吧。

有关图形技术话题,本届CES的发布实则还有不少。有兴趣的同学可以去关注一下今年Omniverse和NVIDIA Studio的更新,也相当有料:比如说去年大火、做游戏MOD的RTX Remix即将提供early access,能把简笔画基于AI转成细节丰富影像的NVIDIA Canvas,新增Canvas 360特性,以及前文就提到的NVIDIA Broadcast新增目光接触功能和虚光效果,还有RTX Video Super Resolution视频串流超分特性等等。

英伟达的全栈软硬件和不同应用方向,应该都是相辅相成的,PC GPU作为游戏显卡时是其中一环。与其说由于英伟达Ada Lovelace更新,今年的笔记本产品可能会和往年不同;倒不如说AI正在深刻变革这个时代,并且深入到每个人生活的方方面面。未来几年GPU的一大看点应该就在AI上。

责编:Illumi
阅读全文,请先
您可能感兴趣
尽管物联网应用的核心特征是连接,但它的另一个基本特征,即信息管理的重要性也日益凸显,随着端点激增且传感器变得越来越复杂,需要处理的数据量急剧增加,我们甚至可以清晰看到这个市场对更先进的处理能力的渴求。
近年来,万物互联和人工智能的发展加速了存算一体技术产品化进程,产业界对于存算一体最终的产品形态也在持续探索。未来存内计算产品将以单芯片和Chiplet两种形式共存。应用场景的多样性也将从物联网边缘端设备向大算力通用计算领域不断拓展,有望成为AI时代主流的计算架构。
今年PC行业的内卷还在持续,尤其AMD和Intel的技术与产品竞争仍处于胶着状态。月初的CES上,AMD面向个人电脑发布的新款Ryzen 7000系列CPU中,继续包含了采用3D V-Cache的型号。除了堆更多的L3 cache,也摒弃了前代的一些痛点,我们来仔细看看...
汽车(Automotive)作为英伟达在财报中给出的单独业务方向,今年的涨势相当不错。FY23 Q3(截至2022年10月30日)季报中,英伟达还特别在给投资者的呈现内容里提到汽车业务势头不错,“正成为我们下一个数十亿美元的平台”。借着近期CES展会上的发布,我们来谈谈英伟达汽车业务的布局情况。
中国本土IC设计公司数量已达到3243家,在这些设计企业中,只有34家企业的人数超过1000人,占总数83.6%的企业是人数少于100人的小微企业,共2711家。对于小微企业来说,即便已经有本地服务器资源,但在仿真需求高峰来临时都会出现资源不足的情况,他们更需要方便、高效、低成本的云上EDA解决方案……
正在举办的CES 2023消费电子展上,Intel公布了更多13代酷睿处理器(Raptor Lake)的产品和技术信息。这些信息应当可以作为未来一整年PC产品性能与功能的预期了。
德州仪器首席执行官Rich Templeton当选SIA副主席
由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
元启新程,焕芯启航
面对市场的周期性变化与增长动力的转换,半导体产业从过去几年的高歌猛进进入理性调整阶段。新的产业变局与行情趋势,考验企业应对周期变化的能力和韧性,既是挑战也是机遇。
汽车智能化,不仅仅是增量,还有存量升级。作为驾驶员观察道路状况的关键车载部件,汽车后视镜(基于凸面镜)最早出现在1906年,随后逐步成为所有车辆的基本标配。不过,由于镜面设计的缺陷,后视镜盲区一直是客
天风证券和芯片超人合办的芯智库2022年举办了27场汽车和各行业专家沙龙,获得产业强烈反响和评价。我们定于2月1日在上海与科技部中国汽车芯片产业联盟联合举办芯智库年度大会暨汽车智能化发展论坛,本次会议
谐振器(无源晶振):无方向性,没有正负极;振荡器(有源晶振):有方向性,有正负极之分。无源晶振无源晶振(KX系列晶振)是被动元件,需要匹配外部谐振电路才可以输出振动信号,自身无法振荡。无源晶振不需要直
今天把最近写的一些代码,拿出来给大伙看看,毕竟丢的是我的脸第一个,是帮忙一个朋友看的力扣题目,然后就自己写了下。题目如下:https://leetcode.cn/problems/median-of-
苏州识光芯科技术有限公司(以下简称"识光")近日宣布完成Pre-A轮融资,本轮融资由BV百度风投领投,汇川产投、浦科投资、猎鹰投资和芯禾资本跟投。识光致力于为自动驾驶、机器人、XR等终端应用提供高性能
广告分割线1月12日,全球设计公司Syntronic Research and Development(以下简称Syntronic)发布新闻稿宣布,已收购总部位于加拿大的印刷电路板设计服务商—— Vi
(纽约2023年1月12日,美通社消息) Shutterstock, Inc.是面向变革型品牌和媒体公司的全球领先创意平台,将帮助推动Meta对人工智能的持续投入。这种关系的拓展反映了两家公司均要在人
看完本期视频,相信您对数字前端验证有了更好的了解!快来评论区分享您的收获,期待与您的每一次互动!
点击上方蓝色字体,关注我们瑞萨RH850 Flash中有两种存储类型:Mapping of Code Flash Memory和Mapping of Data Flash Memory。Mapping
《三体》真人版电视剧即将开播,作为世界顶级科幻IP,“三体”的每一部衍生作品都备受关注,电视剧定档信息一出,再度掀起新一轮《三体》热潮。 去年七月,长江存储与 《三体》联合推出致态TiPr