广告

从Computex谈英伟达GPU生态:苹果M1 Max想跟我比?

时间:2022-06-01 08:36:58 作者:黄烨锋 阅读:
比较令人意外的是,在笔记本这个品类上,英伟达不多见地将自家GPU和苹果M1 Max(MacBook Pro 16”)做了比较,如上图所示。也算是给了苹果在自家发布会任意吊打GeForce RTX GPU的一点回敬吧——毕竟早前发布M1 Max的时候,苹果可是亲口说出其GPU性能媲美笔记本版GeForce RTX 3080的……
广告

以前我们都说,高算力场景对功耗是不敏感的,毕竟真正对功耗敏感的是电池驱动设备。但现在PC台式机、数据中心服务器都在谈功耗和能效,大概和世界主旋律的碳中和有很大关系。今年的Computex上,英伟达谈到如果全球的所有AI、HPC和数据分析工作全都跑在英伟达的GPU服务器上,那么“我们预计每年能够节约超过12万亿Wh,相当于200万辆车一年的消耗”。几个月前的GTC上,Hopper架构GPU,以及Grace超级芯片的发布大概都有往这个方向靠的意思。

今年的Computex(以及ISC国际超级计算机大会),英伟达的新发布和更新主要在系统层面,以及和更多OEM厂商的合作。换句话说,这其实是一次英伟达生态发展成果分享会。虽说全球所有AI、HPC和数据分析工具全都部署英伟达GPU有些夸张,但生态扩张趋势也差不多是这么走的吧:这其中涉及到游戏、专业视觉、汽车、数据中心、机器人、HPC/AI等等。

RTX GPU生态的扩张:亲自下场比M1 Max

大方向上,英伟达的此次新发布主要还是分成了图形计算和数据中心两部分。图形计算相关的,当然不必寄希望于这么快就能看到GeForce RTX 40系列GPU了,这波发布还是生态资讯分享。

英伟达RTX GPU的两大看点在于对光线追踪和DLSS超分特性的支持上。前者基于光线追踪图形技术,通过反向模拟光线的传播,能够实现图形世界更逼真的光影效果;而DLSS则是基于深度学习的Super Sampling技术,可以将低分辨率的画面upscale为高分辨率。这样一来GPU就只需要渲染低分辨率的画面,最终用户也能看到接近原生高分辨率的画质了。

这两项特性是需要“生态”的,或者说需要由游戏或专业图形工具的开发者,做出对应的支持的。这也是RTX GPU真正能够获得用户黏性的基础。黄仁勋在会后的答记者问中说,现在已经有超过250款游戏加入到了RTX生态内,未来还会看到更多。本次英伟达宣布更多游戏加入到RTX生态中(似乎是12款),着重介绍的是《杀手3》以及《F1 22》;这些游戏的最新版应该都已经有了光追和DLSS选项。

除了光追和DLSS,本次“成果分享会”的另一个重点是Nvidia Reflex技术也扩充了合作伙伴团队。我们过去曾撰文介绍过Reflex——它是个面向电竞市场的技术,旨在降低交互延迟——就是从玩家点击鼠标,或敲击键盘操作,到屏幕画面做出响应之间的延迟时间。

Reflex生态涉及的组成部分就相对更为多样了,不仅包含面向游戏开发者的API——实现游戏引擎与渲染的实时“对齐”,而且也需要显示器与鼠标外设厂商做出支持。当前已经支持Reflex技术的游戏有38款,Reflex显示器22款,鼠标45款。

英伟达在主题演讲中提到,游戏《翼星求生(Icarus)》下个月就要对Reflex做出支持了。

Reflex生态的外设产品上,英伟达宣布华硕ROG Swift 500Hz游戏显示器加入Reflex家族。这款显示器采用一种“ETN面板”——应该是指Esports TN面板,“达成最大的动态清晰度”,据说这块面板的响应速度快60%;具备G-SYNC Esports Mode电竞模式支持(一种应用于竞技游戏的预设,包括gamma值调节增加暗部细节等);一个亮点是加入一种所谓的Esports Vibrance模式,据说能让游戏画面色彩更鲜艳;当然也不会缺了Nvidia Reflex Analyzer的支持,即对系统延迟进行检测的工具。

除此之外,英伟达也宣布了本次Computex上由OEM厂商发布的不少新款游戏与工作站级笔电,基于RTX GPU,包括华硕Zenbook Pro 16X、宏碁ConceptD5、联想Yoga Slim 7i Pro X等。

比较令人意外的是,在笔记本这个品类上,英伟达不多见地将自家GPU和苹果M1 Max(MacBook Pro 16”)做了比较,如上图所示。也算是给了苹果在自家发布会任意吊打GeForce RTX GPU的一点回敬吧——毕竟早前发布M1 Max的时候,苹果可是亲口说出其GPU性能媲美笔记本版GeForce RTX 3080的。如我们此前的评测所说,M1 Max的多番落败,与苹果GPU生态落后还是有很大关系。

Omniverse的几个更新:元宇宙得添砖加瓦

图形计算相关的技术更新上,当然不只是合作伙伴的增多。Omniverse也有新能力的引入。Omniverse作为目前英伟达图形计算生态内最重要的平台之一,加速建设原本也是这家公司的常态了。

• 比如说Omniverse Cloud新增了“Simple Share”特性,用户点击一下就能把自己的Omniverse场景发给其他人查看。这原本就是Omniverse Cloud的精髓所在——Omniverse Cloud的本质是将Omniverse云化,在非RTX GPU设备上,也能用Omniverse。

• Omniverse Audio2Face新增了一个叫Audio2Emotion的东西——这是个AI动画特性,基于一个简单的音频文件,就能通过AI生成真实的面部表情;

• Omniverse XR进入beta测试版,这是虚拟现实方面的Omniverse助力;

• Omniverse Machinima更新——Machinima是藉由现有的3D素材(包括各类游戏、动画等),二创电影、短片的平台。本次更新包括加入更多的内容、工具以及素材。

数据中心生态更新:Grace CPU要开始卖了

说完图形计算,就该是英伟达当前营收的另一个支柱:数据中心业务了。更新没多久的英伟达FY2023 Q1财报显示,其数据中心业务季度营收37.5亿美元,同比增长83%——营收占比已经超过了游戏业务(FY2022 Q4就已经超过)。

这一财季对英伟达而言是非常重要的一个季度,因为英伟达在本季发布了很多重磅级产品,包括Hopper架构的新一代H100 GPU,基于NVLink-C2C互联的Grace CPU超级芯片,Spectrum-4 400Gbps交换机、Nvidia OVX——应用于Omniverse数字孪生的可扩展服务器参考设计,医疗设备行业的Clara Holoscan MGX平台等等。

这次Computex上,相关其数据中心业务的更新包括有:

第一,宣布Grace参考设计,就是应用Grace CPU超级芯片(2颗Grace CPU)的一些系统级设计,包括应用于云图形与游戏的CGX,应用于Omniverse数字孪生的OVX,应用于HPC的HGX,以及更偏向于AI计算的HGX。这几个系统全部加上了英伟达自己的Grace CPU超级芯片(2颗Grace CPU封装在一起超级芯片)和BlueField-3 DPU,部分为Grace Hopper芯片CPU+GPU方案。

比如HGX根据不同应用就分成了HGX Grace和HGX Grace Hopper,分别对应于采用Grace CPU超级芯片的版本,以及采用Grace Hopper芯片(Grace CPU+Hopper GPU)的方案。两者都是为2U机架设计的。

对于HGX参考设计,英伟达也面向下游客户提供Grace Hopper与Grace CPU超级芯片模组,以及对应的PCB参考设计。合作伙伴可以基于自己的系统架构来修改英伟达的参考设计,便于打造基于Grace的服务器。

这波宣布的OEM合作伙伴有6家。华硕、富士康工业互联网、技嘉、超微、QCT、纬颖科技等会成为首批Grace系统供应商。Grace系统预计将在明年上半年出货。

第二,发布面向主流服务器的Nvidia Liquid Cooled GPU,也就是加了液冷方案的PCIe板卡GPU。英伟达在主题演讲之前的媒体活动中提到,数据中心大约40%的能耗是用在散热上的,所以英伟达很自然地想到了自己出个液冷方案,应用于数据中心PCIe GPU,“直接芯片液冷散热”。

英伟达表示,这项技术能够达成30%的能耗降低;而液冷数据中心在相同空间下现在就能装下以前2倍的性能了,似乎是因为液冷方案的GPU只占据一个PCIe槽位。而且液冷方案也能帮助达到更高的功耗利用率(PUE)。准备应用液冷GPU的OEM厂商包括华硕、华擎、富士康、技嘉、新华三、浪潮、英业达、宁畅、QCT、超微、纬颖科技、 αFUSION。

第三,发布Jetson AGX Orin开发者套件。Jetson AGX Orin是英伟达去年GTC上宣布要推出的,替代更早的Xavier,是主要可应用于机器人的硬件产品,其上包括安培架构GPU和Arm Cortex-A78 CPU。新发布的Jetson AGX Orin开发者套件售价399美元起。

未来会有不同版本配置(包括CPU核心数)的产品可选,包括Jetson AGX Orin 32GB会在7月发布,AGX Orin 64GB则于10月发布。9月、12月分别将发布Orin NX 16GB和8GB。除了英伟达第一方之外,Computex上也有超过30家OEM厂商发布了Jetson AGX Orin应用和服务器,在机器人、生产制造、零售、运输、智慧城市和医疗健康方面均有涉足。

第四是自动驾驶汽车生态相关的,宣布富士康工业互联网、广达电脑和德赛西威成为DRIVE Hyperion生态下的合作伙伴。DRIVE Hyperion是英伟达面向自动驾驶的计算与感知架构,平台上包含了传感器、网络、安全系统、AI计算芯片等组成部分。最新的Hyperion 9平台内包含有14个摄像头、9个雷达、9个激光雷达、20个超声波传感器。这是个开放的平台,行业参与者可以基于此来构建不同类型的汽车。

整车厂中已知要采用Hyperion 8的企业包括梅赛德斯奔驰、捷豹和路虎等。我们之前对于英伟达的报道较少涉及其汽车方向的业务,主要是因为在英伟达当前的版图里,汽车应用只占到其营收很少的一部分。黄仁勋这次答记者问时说:“这对今天的我们来说还只是一个很小的业务,不过我说过未来6年内,这项业务会产生110亿美元的营收。”可见英伟达对于自动驾驶汽车应用的看重。

如文首所述,今年Computex上宣布的一些英伟达新闻基本都属于生态扩张、现有生态的添砖加瓦。其中不乏一些初生生态的持续跟进,比如说DRIVE Hyperion加入新的合作伙伴、Omniverse引入新特性,以及面向HPC AI的CPU和GPU有了与OEM厂商合作的进一步动向;自然也有成熟生态的扩张,比如RTX GPU获得更多游戏的支持、被更多的硬件产品所采用,以及数据中心GPU增加液冷板卡方案。

最后用黄仁勋在答记者问时的一个理念宣导来做结。他在做总结时,第一想到的是英伟达的AI业务,毕竟这已经是英伟达赚钱的大头了。“我认为AI的下一个发展阶段,是从云里面走出来,走进现实世界。自动驾驶汽车就是个典型的例子。”“有件事情我们一直在做,我想下一个5年我们会有更好的进展,就是把我们喜欢的一切都全面的自动化(automate everything that we enjoy)。”

“不光是智能手机上呈现的那些信息,还有汽车和周围的一切。”“实现这一目标的最佳方法,就是AI。把AI从云上拿出来,放到现实世界里,是我们在努力期盼的。”这话似有将英伟达AI从数据中心,扩展到其他万事万物上的意思。这也让我们更能理解,现在英伟达的行为逻辑中,业务方向大概还在扩展。

责编:Luffy
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
黄烨锋
欧阳洋葱,ASPENCORE 资深产业分析师,常驻上海,专注成像、移动与半导体,热爱理论技术研究。
  • 谷歌挖IBM人才造处理器,元宇宙也10倍薪抢人才? 近日谷歌挖走了在IBM工作了21年、负责IBM Z System芯片的首席架构师安东尼·萨波里托(Anthony Saporito),担任其首席架构师,负责下一代处理器设计。
  • 愈夜愈美丽,2022骁龙之夜上的极致移动体验 2022骁龙之夜上,从手机芯片,到智能驾驶,再到元宇宙,高通再次为业界诠释骁龙是如何为用户所期待的顶级移动体验树立标杆的。
  • 拆解小米12:搭载高通骁龙8 Gen1处理器,散热是怎么处理? 小米12主板依然采用双层板设计,这也是大多数高通旗舰处理器会采用的设计。考虑到新一代处理器的散热需求,小米12在主板芯片、电池、摄像头、屏幕、扬声器、无线充电线圈都准备了大量的石墨贴或是导热硅脂散热。在LDS天线位置还特意增加了白色石墨烯。导热铜管的面积也有所增大。
  • 拆解荣耀60:采用导热硅脂+石墨片散热,国产器件比例再度 荣耀60拆解难度中等,可还原性强。共采用20颗螺丝固定,采用比较常见的三段式结构。SIM卡托、USB接口处采用硅胶圈保护,能起到一定的防尘作用。采用导热硅脂+石墨片的方式进行散热,并未采用液冷管。器件方面的选择,荣耀60中可以看到有众多国产厂商的。
  • 实现系统级效能、功耗与面积的3D-IC小芯片设计 在同一封装中将芯片做3D立体堆栈,和使用硅中介层的多小芯片系统2.5D封装,已经成为新的解决方案。当然,这两种方式也面临着各自的挑战。
  • 元宇宙热潮下,Meta自研7nm芯片,英伟达研发VR超薄全息眼 Meta Reality Labs的研究人员已经制造了一款VR头戴设备原型机,该原型机可以支持Codec Avatars项目的渲染,搭载了专门用于AI处理的定制加速器芯片。此外,英伟达与斯坦福大学展示了一种用于VR的超薄全息眼镜构思......
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。
  • 龙蜥社区:Anolis OS 23正式版将于 近日,龙蜥社区对外公布了下一代龙蜥操作系统(Anolis OS 23)研发路线图,PoC版已在社区官网上线,正式版本将于2023年发布,它支持X86、ARM-v9、RISC-V等多种芯片架构,并集成更多核心自研组件。
  • Matter标准:助力智能家居实现更高水 智能家居行业领先的供应商和潜在供应商已携起手来,为智能家居产品的互通性采取进一步行动,制定新的标准,即基于互联网协议(IP)的Matter标准。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了