GPU在游戏、专业视觉之类的图形应用之外,还广泛用在通用计算加速、数据中心领域。不过如果追本溯源去看GPU的“初心”,用于图形渲染的GPU又发展到哪儿了呢?它和通用计算乃至AI计算的GPU市场比起来如何?

我们现在说英伟达GPU或显卡支持HPC(高性能计算)与AI(人工智能)是相当稀松平常的事了。但实际上从GPU(图形处理单元)的称谓来看,GPU在设计之初都没有考虑过对于通用计算乃至AI计算加速的问题,就更不用说在“GPU”一词出现以前的图形加速卡了。

有关到底是谁最早将GPU用于数据中心的问题已经不大可考。但有几个关键事件,令GPU在游戏、专业视觉之类的图形应用之外,广泛用在通用计算加速、数据中心领域。

其一是2007年英伟达正式发布CUDA,让GPU开始能够用于通用计算加速——这一年英伟达GeForce显卡所用的Tesla架构首次开始采用一种“统一着色架构(unified shader architecture)”——GPU通用计算加速实现的基础。

其二在于2012年英伟达特别针对数据中心市场发布了Kepler架构的Tesla K10显卡。这应该是真正意义上英伟达在数据中心市场着力的开端,即便在此之前的Fermi架构已经在这方面初露端倪。比较凑巧的是,这一年也是当代AI爆发标志性事件AlexNet借助英伟达GPU做加速的一年。

其三为2016年的Pascal架构上,英伟达为Tesla P100显卡引入了Tensor core,也就是相对专用的AI加速单元,在深度计算方面明显下了功夫。当代GPU的使命也在此之后发生了越来越大的变化。或者说我们进入了某种“后GPU时代”。

不过如果追本溯源去看GPU的“初心”,用于图形渲染的GPU又发展到哪儿了呢?它和通用计算乃至AI计算的GPU市场比起来如何?这是本期封面故事期望探讨的。

图1:图形加速卡的最初

图形渲染GPU vs 通用计算GPU

基于市场分析机构给的数据还是太抽象了。我们先来看看英伟达的财报,从中可以知晓很多GPU相关的市场故事。截至2024年1月28日英伟达的Q4 FY24季报显示,这家公司季度营收221.03亿美元,其中游戏(Gaming)业务占比13.0%,专业视觉(Professional Visualization)业务占比2.5%。

这两个与图形渲染最为强相关的业务加起来营收占比也不过15.5%。而数据中心(Data Center)业务目前在英伟达季度总营收中的占比已经高达83.3%。这是个何其恐怖的数据。

要知道早在2020年我们说此前5年是英伟达的黄金时光,当时游戏+专业视觉业务在整个公司的营收占比还高达65%,数据中心则刚走到了25%。短短3、4年间,GPU的价值大头似乎已经从图形渲染明确地偏移到了通用计算、HPC与AI。如果把时钟再往回拨,英伟达的PC业务方向营收占比曾高达近80%,其中超九成都来自游戏与专业视觉市场。

当然这个数据还是太过粗粒度了,毕竟英伟达的数据中心业务也有相当一部分是图形加速卡。只不过这样的趋势还是显得十分明晰。

那么是不是包括游戏在内的图形渲染GPU市场在萎缩呢?也还真不是这么回事。Q4 FY24季度,英伟达游戏业务营收28.65亿美元。这个数字和数据中心业务的184.04亿美元当然是完全不能比的。但28.65亿美元已经是英伟达历史上游戏业务获得的最好成绩。如果拉长时间线至4年,那么英伟达的游戏业务营收实际增幅是超过了1倍的。

比较遗憾的是,我们未能从统计机构的数据中找到图形渲染GPU与通用计算GPU的现有市场价值切分数字。但我们认为,英伟达的财报已经是对这一问题的生动阐释了。只不过如果将AI算作一种特殊的通用计算类型,那么图形渲染与通用计算的确很难做切分,毕竟广大的PC端侧GPU未来可是既要做图形渲染,又要做AI推理加速的;数据中心领域的某些视觉类应用亦如是。

有个八卦数据值得参考,2月份媒体普遍在报道Sam Altman(OpenAI首席执行官)提及发展满足算力需求的AI芯片需要7万亿美元。虽然这个数字大有媒体后期加工的成分,但前不久Intel的Direct Connect活动上,Altman在与Pat Gelsinger(Intel首席执行官)炉边对谈时说,他虽然并不清楚要达成AI技术发展目标究竟需要多少钱,但一定是“很多很多钱”,创造属于半导体的价值也远多于产业此前估计2030年的万亿美元量级。

基于统计机构普遍预测GPU作为AI芯片的某一个大类,虽然未来其市场占比将会下降,但也仍然是主流;很显然在接下来的这10年里,GPU作为涵盖AI加速的通用计算职责及市场价值,将显著高于其图形渲染的目标市场。

真的是这样吗?

图2:游戏显卡

为什么会有那么多新玩家

如果说“GPU”是指广义的专用图形相关电路,那么GPU从诞生至今可能有50年了。单说PC及工作站图形渲染GPU,自上世纪90年代至本世纪初,这个市场不说彻底成型,也基本达成了高度成熟,最终以英伟达、AMD的双寡头市场形成为标志。这一点我们在去年相关GPU的封面故事中提过。

在社会整体的数字化转型过程里,GPU和图形渲染加速的蛋糕又被做大了,而且出现了一些新的应用场景——不单是游戏和影视。不谈GPU通用计算、AI崛起造就新的市场机遇;数字化转型、万物互联对海量IoT设备提出了图形应用需求。

另外从英伟达的营收数字来看,游戏业务本身也在不断增值,即便没有数据中心那么快。可能很多读者并不知道,游戏产业的市场价值是电影产业的2倍以上,是音乐产业的将近10倍,且每年还在增长——虽然芯片并不是其中唯一的组成部分。

换句话说,这个市场是在持续做大的。而且游戏本身作为现阶段图形学应用的核心,其涉及的门类庞杂且多样,绝不单是游戏本身。要不然微软为什么要花那么多钱收购动视暴雪?

再加上地缘政治(包含信创市场的GPU需求)及全球市场不确定性提出的技术自主化、本地化需求,GPU市场过去两三年算得上十分热闹。如果算上GPU IP供应商,那么全球现有的GPU企业可能不少于20家,尤以中国市场最为集中。就算抛开景嘉微这类中国老牌显卡企业不谈,这些年在图形渲染GPU领域的新晋市场参与者也至少包括了摩尔线程、沐曦、瀚博、芯动科技等——其中有一些既做GPGPU,也做图形渲染GPU。

Imagination去年干脆直接推出了面向PC桌面端的GPU IP,主流图形API、光线追踪等新特性的支持还一应俱全。则Imagination的GPU IP覆盖了从IoT嵌入式应用,到汽车、到手机、到PC、到工作站、到数据中心等不同场景。在我们看来,这是市场需求显著提升,以及技术自主化、地域化需求的共同作用。

即便大家普遍在质疑Imagination杀入桌面端GPU的红海究竟为了什么,Imagination首席产品官James Chapman在接受我们采访时就提到,推出面向桌面PC的GPU IP是因为“客户看到了市场需求”,同时“他们的客户也期望找到替代方案”,不仅是中国客户,“我们也看到全球市场的客户在寻求英伟达、AMD以外的产品”。

所以总的来说,图形渲染GPU市场之所以会有这么多新玩家入局,其一是原有市场的扩大,其二是技术自主与本地化趋势——以及供应链的弹性化需求,促成市场的发展——即便这一市场和AI还是不能比。

但我们认为,还有一点更重要:元宇宙。元宇宙作为一个数字化的虚拟世界,其外在构建是严重依赖于渲染的。

可能在很多人看来,元宇宙这个概念早就退热了。Meta这样的企业几乎All In元宇宙这两年烧钱烧得十分惨烈。这样的东西还真能带来什么收益和产业影响力吗?

此前瀚博半导体在WAIC上宣布准备推出支持图形渲染的GPU时,我们问过瀚博半导体CEO钱军为什么要进驻这一市场。瀚博半导体此前是AI芯片领域的一员,尤其着力在图像、视频处理与计算上。“像素世界如果只能看,而不能产生,那不是完整的拼图。”钱军说。图形渲染显然就是“产生”“像素”的。

这家公司一直以来的口号是“致力于为像素世界提供浩瀚算力”。大概前期切入于像素的处理与理解,后续则追求像素的产生了。这可能某种程度体现了AI与图形渲染的和谐统一,以及瀚博半导体有意于元宇宙方向的潜在规划——虽然这家公司从未明确说过。

老掉牙的“元宇宙”?

PC游戏领域有个很流行的技术:游戏画面的AI超分与补帧。英伟达、Intel之类的企业都有对应的技术方案。这类技术追求的是,GPU渲染一部分像素,AI基于这些像素再生成一部分像素。其价值在于显著减少游戏过程中GPU图形渲染压力,将更多的工作交给AI完成。

黄仁勋(英伟达创始人兼CEO)甚至说,现在(支持DLSS)的游戏有75%的像素和一半的帧是由AI生成的。这类有趣的技术既体现了AI的价值,及其对图形渲染技术的侵门踏户,而且也展示了图形渲染与AI的和谐共生,在渲染与生成像素上的协力。元宇宙对于算力的贪婪需求,是图形渲染技术的暴力发展所无法达成,以及必然要求AI参与的。

但这些还不足以表明元宇宙真的有多大市场,以及它能为图形渲染带来多大价值。另一件挺有趣的事情是去年的SIGGRAPH顶会上,根据我们自己的统计,黄仁勋1小时20分的演讲,平均一分钟就要提一次生成式AI。SIGGRAPH可是个图形技术顶会,拼命聊AI是怎么回事?

黄仁勋在这次的SIGGRAPH上有个令人印象深刻的演示,给生成式AI输入一张工厂的二维CAD平面图PDF文档,提出一句话的简单需求,最终由AI转成了3D虚拟工厂(图3)。这一基于AI得到的工厂数字孪生基本是物理级精准的。这个过程明确结合了生成式AI与图形技术。

图3:基于生成式AI将一份PDF文档转为3D虚拟工厂

当然这套流程远没有我们形容得那么简单。它涉及到好几个具体的模型,以及光线追踪、USD格式图形标准等——USD最早是由皮克斯提出广泛应用于3D动画、CG等领域的标准格式。而且起码现阶段,我们还不大相信工厂数字孪生可以无人为干预的方式这么简单地做出来。但这个方向及可行性是得到了最基本的验证的。

工厂数字孪生本质上就是一种狭义的元宇宙,或者说得更明确一些,具备逻辑且越来越达成物理级精准的游戏世界,就是元宇宙的雏形。基于未来经济的虚拟化发展需求,以及AI辅助下,无论工业元宇宙还是生活元宇宙的构建,GPU图形渲染都是基本与核心能力。

要知道,工厂数字孪生是未来生产力发展的必要组成部分。至此多少应该能够理解“产生像素”作为“完整拼图”的重要性了吧。而AI作为一种数字世界的技术,令其更多地在现实世界发挥作用,很多时候还是需要借助虚拟世界的。AI与图形也就成为未来人类数字生活两大基础技术。

其实此刻再回头看本文第一部分列举英伟达的数据中心业务营收占比远超游戏+专业视觉,此间忽略了一个重要事实:英伟达的数据中心业务里,有相当一部分芯片、系统、软件与解决方案是面向Omniverse(全宇宙)的——也就是英伟达版本的元宇宙。

虽然我们并不清楚其中占比多少,且明确它现阶段必然低于纯粹的AI数据中心业务构成,但在我们看来,以Omniverse为代表的虚拟世界,将会是AI、生成式AI发展的高级应用阶段,并在未来表现出难以估量的潜在价值。

新晋市场参与者的困境

无论是图形还是AI生态,都需要长时间的积累。似乎这两部分,英伟达都有着毫无疑问的先发优势。这一切的缘起都是游戏,而且未来的很多技术大概率还会受惠于游戏。所以即便游戏业务不再是英伟达赚钱的主力,相信这家公司也会坚持将这部分持续做下去——因为它涉及的图形技术旁支实在是太丰富了。

这也事实上形成了对新晋市场参与者的门槛。我们知道摩尔线程早就开售了自家的消费级桌面显卡,标称的算力水平已经接近于英伟达GeForce RTX 3060,更是将中国老一批GPU市场先驱远远甩在身后。但真的跑起游戏来,效率还是差了一大截的。

Imagination即便也积极地参与到桌面GPU市场的竞争中来,图形API的支持也就刚到了DirectX 11_0。目前也没有可真正验证其高性能特性的GPU芯片问世。

就连Intel这样有长期集显设计经验、这两年决心角逐桌面显卡市场的国际巨擘,也在第一轮独显产品竞争中相距英伟达甚远:即便拥有看起来相当不错的理论性能,具体到实际的游戏与视觉类应用里也就一言难尽了。从显卡产品问世至今,驱动更新了30+个大版本,才让游戏效率逐渐合格。

可见在图形卡市场,英伟达、AMD的优势地位还将长期存在。当然桌面PC未必是未来图形技术竞争的主战场,这里也只是举了个例子。但在以后合作设计、数字孪生、元宇宙需求AI+图形技术的场景中,英伟达显然还将基于生态上的积累保持长时间的优势地位。

这将是一众新晋市场参与者都需要面对的问题和困境。

图4:英伟达的图形卡

最后值得一提的是:图形技术的价值直观体现在游戏和影视作品中,但实际上我们见到过上层建筑基于民用领域的图形技术——尤其是物理级精准的游戏,来做相关国家安全高度特定场景的仿真与模拟。那么技术自主化大潮趋势之下,寻找英伟达、AMD的替代方案可能是必由之路。

本文为《电子工程专辑》2024年4月刊杂志文章,版权所有,禁止转载。免费杂志订阅申请点击这里

责编:Franklin
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
RISC-V 在新兴应用中具有意义,因为这些领域的开发人员尚未拥有现成的 Arm 产品。人工智能的兴起、用例和功能的增加意味着许多新领域正在萌芽,而RISC-V在所有这些领域都具有潜力……
AI PC现在是个热词,连苹果都打算入局了,6月份的WWDC上大概就能见到。本文尝试盘点AI PC的竞争现状与实质...
EIC7700X包括EIC7700/7702及其加强版EIC7700X/7702X,其中EIC7700X是一款性能优异的边缘计算SoC芯片,EIC7702X是一款高算力AI PC芯片。全系产品搭载64位RISC-V乱序执行CPU及自研高性能NPU……
值得一提的是,美国最近几年在产业扶持上大把“撒钱”,比如《芯片与科学法案》《通货膨胀削减法案》,加上高企不下的通货通胀,如果再将巨额的资金投入到AI技术上,将面临较大的财务挑战。
随着气候变化的影响,人们对了解海洋的需求日益迫切,使用遥控潜水器(ROV)和自主水下航行器(AUV)收集数据开始面临独特的挑战。它们的建造和维护成本高昂,通常需要大量专业人员进行部署和回收。它们的庞大体积也给执行任务时的灵活性和机动性带来了挑战。
目前尚不清楚该芯片具体采用的是三星 Foundry 的第一代 (SF3E) 还是第二代 (SF3) 3nm GAA 工艺。考虑到智能手机芯片的复杂性,推测很可能是采用更适合复杂芯片的第二代工艺。
工程师对某个方案的选取,需要考虑系统性能,器件参数,成本等多个因素。HP1010 的测试数据证实,图腾柱拓扑在收获高效的同时, 可以安全可靠的运行;结合特有的控制算法,电流互感器方案简洁灵活,并且CBC保护性能出色。
2024年第一季度全球云基础设施服务支出同比增长21%,达到798亿美元,增加134亿美元。三大云提供商——AWS、微软Azure和谷歌云——合计增长了24%,占总支出的66%。
当前,5G发展已行至中场,5G Advanced正在加速落地,不仅将进一步释放5G全部潜能,还将为6G奠定技术基础,加速推动未来十年的创新。
Ampere Computing® 今天正式发布年度战略和产品路线图更新,重点介绍 Ampere 在可持续、高效能计算的云和人工智能计算方面的持续创新和发明。
电池技术一直以来是光伏技术路线之争的焦点。光伏行业里突破性的技术创新往往能重塑行业格局。钙钛矿电池作为火热的下一代光伏技术,几次三番站上风口浪尖。2023年,从小面积到大尺寸、高效率,从实验室到生产线
NVIDIA 带来知乎精彩问答甄选系列,将为您精选知乎上有关 NVIDIA 产品的精彩问答。本期是解读 NVIDIA GTC 2024 发布的新技术第五期。以下四个知乎甄选问答将为您带来更多关于 NV
来源:IT之家5 月 20 日消息,据 Kedglobal 报道,韩国科技巨头 LG 电子公司终止了与 Meta 在扩展现实 (XR) 领域的合作。此前,双方于今年 2 月达成协议,将共同开发包括虚拟
5月19日消息,360集团创始人周鸿祎近日发布视频,大胆预测中国汽车产业未来的全球地位。他表示,最快在五年内,中国汽车的市场份额有望超过全球市场的50%,从而达到世界第一的水平。周鸿祎的预测基于多个观
插播:6月14日,汇川、锦浪、英飞凌、芯联动力、扬杰科技、蓉矽、普兴、合盛、晶瑞、希科、丰田商社、大族、泰克、志橙、凯威及泽万丰等邀您参加上海SiC大会,详情可点击文末阅读原文。近段时间,新能源汽车相
近日,国家市场监督管理总局(国家标准化管理委员会)批准发布一批重要国家标准,其中由天马牵头的两项液晶显示器件领域国家标准在列,分别是GB/T 18910.2-2024《液晶显示器件 第2部分:液晶显示
插播:6月14日,汇川、锦浪、英飞凌、芯联动力、三安、天岳、扬杰科技、蓉矽、普兴、合盛、晶亦精微、希科、丰田商社、大族、泰克、志橙及泽万丰等邀您参加上海SiC大会,详情请点击文末【阅读原文】。SiC已
插播:6月14日,汇川、锦浪、英飞凌、芯联动力、扬杰科技、蓉矽、普兴、合盛、晶瑞、希科、丰田商社、大族、泰克、志橙、凯威及泽万丰等邀您参加上海SiC大会,详情可点击文末阅读原文。随着新能源汽车市场对于
据港媒报道,近日,香港立法会财务委员会批准了高达28.4亿港元(折合人民币约26.33亿元)的拨款,用于设立一个专注于半导体研发的中心——香港微电子研发院。香港微电子研发院将专注支持第三代半导体,包括
5月20日, Y200系列新品发布会推出vivo Y200,vivo Y200 GT以及vivo Y200t三款新品,全系标配6000mAh大电池。敏锐洞察到用户对长续航和轻薄耐用的使用刚需,本次新品