老黄:摩尔定律已死,涨价身不由己!晶圆级&裸片分析:为什么英伟达RTX4090卖这么贵?

原创 EETOP 2022-09-25 12:19
EETOP专注芯片、微电子,点击上方蓝字关注我们
NVIDIA这两天发布了RTX 40系列三块显卡,升级4nm工艺及Ada Lovelace架构,10月12日上市,价格分别是12999、9499元及7199元。
对于RTX 40系列三款显卡,性能提升很猛,但是这两天大家讨论最多的就是显卡价格,RTX 4090显卡达到了12999元,RTX 4080 12GB甚至还是192bit位宽,价格从上代的5499元起步涨到了7199元,这样的定价被网友吐槽太贵。
不过黄仁勋表示表示摩尔定律已死,涨价也是身不由己。

以下内容为tomshardware通过晶圆价格以及裸片渲染图做出的成本分析,文章基本上认可了老黄关于涨价的说辞,但同时也认为AMD可以推出更具有性价比的显卡,会对RTX 40带来较大冲击。

以下是正文:
原文链接:
https://www.tomshardware.com/news/why-nvidias-4080-4090-cost-so-damn-much
英伟达 RTX 40 系列和 Ada Lovelace GPU的推出受到了一系列的欢迎。在构建一个有望超越最好的显卡的 GPU 时,英伟达(Nvidia) 已经做得很大——又大又贵。另一方面,AMD 正在使用一种更具成本效益的技术,可以使其即将推出的 RDNA 卡更具吸引力、更实惠的选择。
虽然我们不了解英伟达的材料清单 (BOM),但英伟达 GPU 的高价格很大程度上是由于该公司拒绝接受“摩尔定律 2.0”并寻求小芯片之类的东西。当 AMD 转向小芯片时,AMD 开始在 CPU 上击败英特尔,尤其是在成本方面,现在他们将在 GPU 上做同样的事情。使用 RDNA 3 将模拟存储器接口放在较旧的工艺上是一种绝妙的方法,因为模拟在较新的工艺节点上的扩展性很差。缓存也是如此。 

查看 英伟达 迄今为止发布的 AD102(RTX4090) 芯片照片,我们知道芯片尺寸为 608mm²。这仅比 628mm² 的 GA102(RTX3090Ti)略小,但现在 英伟达 采用了最先进的 TSMC 4N 工艺节点,而不是三星 8N。晶圆的价格肯定上涨了,而且台积电在2023年还要将价格上涨 6%。下图所示的 AD102渲染图,显示了一些清晰的细节,说明了 英伟达 最新的显卡芯片为什么会比上一代芯片的成本更高。

12 个图形处理集群 (GPC) 很容易与芯片的其余部分区分开来,每个都有 12 个流式多处理器 (SM)。所有的 GPC 和 SM 加起来约占总芯片面积的 45%。剩下的去哪儿了?十二个 32 位 GDDR6X 内存控制器占用了芯片的大部分外围边缘,而 PCIe x16 连接器使用了大约三分之一的底部边缘。内存控制器和相关电路占据了 17% 的芯片面积,不管多大,但这并不是内存子系统的唯一部分,因为 英伟达 的二级缓存比以前的设计大得多。您可以在芯片的中心部分看到六个 16MB 的 L3 块,周围有一些相关的布线和其他电路 (ROP?)。L2 缓存块至少占芯片总面积的 15%,而芯片的整个中心部分(L2 加上其他逻辑)占总面积的 25%。底部芯片的其余部分专用于双 NVENC 编码器、PCIe 接口和物理显示接口等。它大约占总数的 7%,然后还有一些其他杂项分散在周围,占据了芯片裸片的最后约 6%。

讨论这些裸片区域的目的是帮助正确看待事物。英伟达 在 AD102 芯片上采用单片方法,将大约 33% 的总裸片区域专门用于内存接口和 L2 缓存。

AMD 的 MCD(Memory Chiplet Die)方法与Radeon RX 7000 系列和 RDNA 3 GPU一起使用,显然将几乎所有这些都从主芯片上移开,据报道它将使用 TSMC N6 代替 TSMC N5,从而降低价格并提高产量同时。台积电没有透露其与苹果、AMD、英特尔或英伟达等大型合作伙伴的合同谈判情况。然而,有报道称台积电 N5(以及因此或多或少只是“精制”N5 的 4N)成本至少是台积电 N7/N6 的两倍。AD102 的裸片尺寸为 608mm²,英伟达每个晶圆只能获得大约 90 个完整裸片——作为参考,每个晶圆仅比 GA102 多两个芯片。

如果台积电 4N 的每个晶圆成本是三星 8N 的两倍以上,这意味着 AD102 每个芯片的成本是上一代 GA102 和 RTX 3090 的两倍多。PC World 的 Gordon Mah Ung 在问答环节中向英伟达首席执行官黄仁勋提问关于定价的会议:

Gordon:[RTX] 4000 终于来了,我敢肯定这对你来说是一次巨大的发布。我看到的普遍反应是,“哦,我的上帝。它要花这么多钱。” 关于新一代零件的定价,您有什么想对大家说的吗?此外,他们能否期望在某个时候看到更好的定价,并基本上解决我在各处看到的所有大声尖叫?”

黄仁勋: “
首先,今天的 12 英寸晶圆比昨天贵很多, 而且它不是贵一点。摩尔定律已死。而摩尔定律提供相同性能,每年半成本一半的能力已经结束。完全结束了。因此,不幸的是,芯片成本会随着时间的推移而下降的想法已成为过去。”

当然,构建显卡不仅仅是 GPU。内存,涉及PCB、VRM、PMIC、电容器和其他各种位,其中许多产品的价格在过去两年中也有所上涨。英伟达也不得不在GPU和相关产品的研发上投入大量精力。

关于 RTX 40 系列公告的另一件有趣的事情是,英伟达公布了三种不同的显卡型号,每一种都使用不同的 GPU。同样,这种方法必须增加成本,这意味着英伟达还需要弄清楚如何最好地分配其晶圆订单。RTX 4090 中的 AD102 芯片是新的光环部件。AD103(RTX4080 16G) 减少了内存接口和内核数量,然后在 AD104(RTX4080 12G) 进一步减少了它们。

英伟达尚未发布AD103和AD104的芯片或效果图,但我们确实有完整的规格。它们要小得多,其中大部分来自减少内核数量,内存接口和L2缓存大小。4080型号自然会比4090大批量产品,但值得指出的是,4090的计算能力可能增加70%,内存带宽和容量增加50%,功耗增加41%,而成本“仅”高出33%。换句话说,RTX 4080 16GB的定价比RTX 4090差。我们可以对RTX 4080 12GB执行相同的分析。4080 16GB 的计算能力提高了 21%,内存容量增加了 33%,内存带宽增加了 42%,但功耗仅增加了 12%。它的成本也高出33%。与我们在以前的英伟达架构中看到的相比,这两种RTX 4080型号看起来价格过高且功率不足,其中halo卡的成本要高得多,,而性能只能适度提高。


当RTX 30系列推出时,英伟达从RTX 3090和3080开始。两者都使用GA102芯片,只是在3080上启用的内核更少。接下来是RTX 3070和3060 Ti,两者都使用GA104芯片。最终,英伟达将GA106添加到该系列中,用于RTX 3060和3050 - 移动RTX 3050 Ti和3050也有GA107,但这从未出现在台式机上。最终,仅查看台式机显卡,英伟达 拥有三种不同的 GPU,为十种不同的显卡提供动力。现在,英伟达公布了三款卡,使用三块GPU,它必须弄清楚如何平衡每个芯片的数量。

相比之下,AMD似乎将在11月3日宣布可能使用单核GPU,它将使用小芯片技术。目前的信息显示,GCD(GPU Chiplet Die)的尺寸仅为308mm²,约为AD102尺寸的一半,并且它将与多达六个相对较小(38mm²)的MCD(内存芯片芯片)连接。这与AD104(294.5mm²)的尺寸大致相同,如果传言是正确的,AMD的Navi 31将配备多达12,288个GPU着色器内核 - 比英伟达的RTX 4080 12GB高出60%。

AMD可以使用相同的GCD推出RX 7900 XT,RX 7800 XT,甚至可能推出RX 7800,只是启用了不同数量的GPU内核以及6,5或4个MCD。AMD甚至可能在定价上与AD104竞争,同时提供明显更高的性能,至少在没有利用DLSS 3和/或极端光线追踪效果的游戏中是这样。优势:AMD。

还有一个问题是为什么 RTX 4080 12GB 不只是被称为 RTX 4070。在简报中与 英伟达 交谈时,这个确切的问题出现了:将 12GB 芯片称为 4080 而不是 4070 背后的思考过程是什么,尤其是因为它是一个不同的芯片?英伟达 的产品管理高级总监 Justin Walker 说:“4080 12GB 是一款非常高性能的 GPU。它提供的性能比 3080 12GB 快得多……它比 3090 Ti 快,我们真的认为它值得是80级产品。”

坦率地说,这是一个蹩脚的答案。当然更快!这是一个新的芯片和一个新的架构;它应该更快。还记得GTX 1070问世时,它比980 Ti更快吗?我想这不是“值得”的80级产品名称。RTX 2070在与1080 Ti匹配时也不是3070,也不是与2080 Ti匹配时的3070。这就是你必须开始思考的地方,因为很明显,在重光线追踪游戏中,DLSS 3就是这样。当您不玩符合这些条件的游戏时会发生什么?

根据英伟达的基准,这将好坏参半。左图中的前三个游戏不使用 DLSS 或 DLSS 3。RTX 4080 12GB通常与RTX 3090 Ti捆绑在一起或略慢,而DLSS 3和光线追踪不是等式的一部分。在未来的比赛中,这种情况会持续多久一次,这要难以预测。在很多方面,迄今为止发布的 RTX 40 系列让人想起 RTX 20 系列的发布。英伟达再次大肆宣传光线追踪和DLSS,只是我们现在正处于这个故事的第三轮。RT硬件的功能要强大得多,DLSS 3也应该好得多,但是所有大型游戏都会将这两种技术都支持到足够的水平吗?毫无疑问,答案是否定的。有些会,有些不会。与此同时,代际定价(再次)有所增加,一些型号的规格肯定看起来值得怀疑。RTX 4080 12GB感觉太像现在应该真的是RTX 4070了,英伟达本可以开始使用Ti和Super或其他任何东西来创建其他型号。

RTX 3080 10GB显然仍将停留在699美元的建议零售价暂时。这当然不会长久,因为最终的RTX 4070将不可避免地在性能和功能上取代它。但英伟达和它的合作伙伴需要不知情的人买下现有的RTX 30系列卡的库存,以他们仍然可以得到的最高价格,然后他们准备下栈到其余的Ada Lovelace阵容。

我们还在等待AMD RDNA 3产品线的详细信息,正如上面所讨论的,AMD做出的设计决定——特别是GPU芯片——应该会导致英伟达无法匹敌的更低价格。AMD可能不会在性能上独占鳌头,但如果它能在价格低于英伟达的情况下与之接近,那可能就没什么关系了。此外,英特尔的Arc A770和A750也可能在不久的将来推出。在接下来的几个月里,我们将看到谁会成为GPU市场的胜利者。


汽车芯片视频+PPT

EETOP EETOP半导体社区-国内知名的半导体行业媒体、半导体论坛、IC论坛、集成电路论坛、电子工程师博客、工程师BBS。
评论 (0)
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦