广告

英伟达发布RTX30系列显卡,与三星、美光合力打造

时间:2020-09-02 作者:综合报道 阅读:
英伟达公司(Nvidia)当地时间周二发布了一系列功能强大的游戏显卡:GeForce RTX 3090、3080和3070,新产品将以比以往芯片版本高两倍的性能和几乎两倍的功率改善视频游戏图形。最新GPU基于全球速度最快、效率最高的第二代 RTX 架构 Ampere,采用美光科技的新存储技术设计,并且由三星电子代工生产……
广告
ASPENCORE

9月2日,据外媒报导,英伟达公司(Nvidia)当地时间周二发布了一系列功能强大的游戏显卡,由于疫情原因,发布会地址还是选在了英伟达首席执行官黄仁勋(Jensen Huang)家中的厨房——远程视频发布。c7REETC-电子工程专辑

相关阅读:烤箱搬出最大显卡后,英伟达在厨房发布了7nm安培GPUc7REETC-电子工程专辑

发布会上,黄仁勋激动地表示:“20年后,我们再回首往事,会发现游戏从今天起腾飞。”c7REETC-电子工程专辑

c7REETC-电子工程专辑

新发布的GeForce RTX 3090、3080和3070显卡将以比以往芯片版本高两倍的性能和几乎两倍的功率改善视频游戏图形。显卡GPU基于全球速度最快、效率最高的第二代 RTX 架构 Ampere,采用美光科技(Micron Technology Inc)的新存储技术设计,并且由三星电子(Samsung Electronics)代工生产。c7REETC-电子工程专辑

系列显卡的价格从499美元到1499美元不等:c7REETC-电子工程专辑

c7REETC-电子工程专辑

  • 售价为499美元的RTX 3070的运行速度比售价为1199美元的RTX 2080 Ti快,并且比其最初的RTX 2070快60%;
  • 售价为699美元的中端RTX 3080的运行速度比RTX 2080快两倍;
  • 售价为1499美元的RTX 3090被称作“8K BFGPU”,运行速度比其旗舰产品Titan RTX快50%。

性能、价格和体格上的巨兽——RTX 3090

RTX 3090不光是性能巨兽、价格巨兽,体格上也是,足足占用了三个 PCI 槽,高度长度都秒杀如今所有显卡,黄仁勋在发布会视频中要拿起这块显卡都超级吃力。c7REETC-电子工程专辑

c7REETC-电子工程专辑

这是首张能驱动 8K 游戏的显卡,可在 RTX 开启、DLSS 8K 和 HDR Shadowplay 功能下进行 8K 游戏,并且在大部份现代游戏中可达到甚至超越 60fps。不过现在 8K 的显示器或电视都非常稀少,小编暂时还没Get到这款万元级显卡的最佳用途。c7REETC-电子工程专辑

c7REETC-电子工程专辑

和早前流出的消息差不多,RTX 3090 有着更坚固的机械结构,全新的低矮叶片弹簧,全新的12针电源接口,以英伟达的说法是能“提供更多组件和散热所需的空间”,但还是能通过专属的转接器与现有的 8 针脚电源相容。PCB电路板比上代缩小一半。c7REETC-电子工程专辑

处理能力为30 Shader-TFLOP/s,超过 2080 Ti 的 13.4 TFLOPs 一倍,FP32浮点吞吐量是上一代的2倍c7REETC-电子工程专辑

c7REETC-电子工程专辑

同时具备第二代RT Core(光追核心) 计算能力为58 RT-TFLOPS,是上一代的2倍, 支持光线追踪、着色与计算。c7REETC-电子工程专辑

第三代Tensor Cores(张量核心) 算力高达238 Tensor-TFLOPS,是上一代的2倍,能够更快速、更高效地运行AI技术,比如DLSS深度学习超采样抗锯齿。c7REETC-电子工程专辑

c7REETC-电子工程专辑

以往当 GPU 需要图形数据时,都需要通过 CPU 呼叫来调用存取,而NVIDIA RTX IO实现了基于GPU的快速加载、游戏资源解压,输入/输出性能是传统硬盘存储的最高达100倍,并结合微软全新的Windows DirectStorage API,可以让GPU接手原本需要几十个CPU核心的工作,从而实现近乎瞬时的游戏加载,上次哪里退出现在就从哪里直接开始,而且帧率更高。c7REETC-电子工程专辑

但这功能要等待游戏开发者实作,届时才能真的感受到 PCIe Gen4 SSD 对于游戏读取效能的提升。c7REETC-电子工程专辑

c7REETC-电子工程专辑

RTX 3090 支持 HDMI 2.1,可用一根数据线连接到8K HDR电视,实现超高分辨率游戏。可以输出达 4K 120Hz 的画面,也内建了变动调节帧率的能力,如果显示器有对应的支持的话,就能避免撕裂了。这也是首款支持全新AV1解码器的独立GPU,8K HDR网络视频所需带宽比以往减少50%。c7REETC-电子工程专辑

c7REETC-电子工程专辑

散热方案采用双轴流通式,一体成型前后双风扇设计(RTX 3090/3080),结合机箱风扇和风道,散热性能比上代提高2倍,风流增加55%,效率提高30%,静音提高3倍。c7REETC-电子工程专辑

c7REETC-电子工程专辑

RTX 3080 效能加倍、价格减半 

主流 GeForce RTX 3080 是旗舰级游戏卡,标准的 2 Slot、长高设计,并采用新一代散热设计,通过缩小电路板、正反双扇,以及更多的散热鳍片,确保显卡 GPU 与背面不会产生热点,并引导机壳散热气流。c7REETC-电子工程专辑

c7REETC-电子工程专辑

GeForce RTX 3080 效能将是 RTX 2080 的两倍提升,具备着 30 Shader-TFLOPS、58 RT-TFLOPS、238 Tensor-TFLOPS,搭配着 10GB G6X 内存,等效频率19GHz,可以在4K分辨率下获得60FPS稳定帧率。c7REETC-电子工程专辑

c7REETC-电子工程专辑

有趣的是,RTX 3090 和 RTX 3080 发布后,美国媒体报道称GPU 市场突然涌入大量二手 GeForce RTX 2080 Ti 显卡,价格甚至低于 500 美元。而在以往,这款显卡二手平均价格在 600-700 美元左右。c7REETC-电子工程专辑

c7REETC-电子工程专辑

RTX 3070 击落上代卡皇 RTX 2080 Ti

相对 3090 与 3080 的新设计,GeForce RTX 3070 维持类似的设计,但改回熟悉的正面双扇配置,并有着击落上代卡皇 RTX 2080 Ti 的效能。c7REETC-电子工程专辑

c7REETC-电子工程专辑

GeForce RTX 3070 具备着 20 Shader-TFLOPS、40 RT-TFLOPS、163 Tensor-TFLOPS,搭配着 8GB G6X 内存。c7REETC-电子工程专辑

RTX 3070定位在4K、2K游戏甜点卡,价格不到RTX 2080 Ti的一半,但是平均性能更高,同时比RTX 2070快足足60%。c7REETC-电子工程专辑

c7REETC-电子工程专辑

三星定制化8nm工艺,美光GDDR6显存

英伟达长期以来一直与各种芯片制造商合作生产GPU,最近则更多依靠台积电(TSMC)生产最先进的芯片。c7REETC-电子工程专辑

令人疑惑的是,本次三星将采用8纳米工艺,而不是最新的5纳米工艺制造新的GA102-300 GPU。三星 8 纳米工艺是在 2017 年开始量产,作为进军 7 纳米 EUV 所铺陈的技术,主要仍是延续 10 纳米工艺。虽然三星 7纳米其实也已量产,但比较起来,8 纳米更为成熟,所以才获得英伟达采用。c7REETC-电子工程专辑

c7REETC-电子工程专辑

对此,英伟达方面也表示,他们与三星合作定制了工艺流程,因此英伟达芯片将比使用相同8纳米工艺的其他三星制造的芯片快约10%。c7REETC-电子工程专辑

不过依之前的消息来看,英伟达用三星最大的原因应还是在于价格,据传三星产能还有不少空缺,可以近台积电 6 折的价格来抢单。c7REETC-电子工程专辑

这颗GPU集成多达280亿个晶体管,拥有 10496 个 CUDA 核心,频率 1.70 GHz, “处理技术要复杂得多。我认为人们已经将其简化到几乎荒谬的程度,”黄仁勋在上个月的一次电话会议上对投资者说,并解释了为什么该公司并不总是使用最新的芯片制造技术。c7REETC-电子工程专辑

英伟达的芯片使用多种技术来提高图形性能,例如使用人工智能处理器来预测光线在场景中如何移动,而不是手动计算每条光线。c7REETC-电子工程专辑

最新的芯片还使用了美光自2006年以来一直在开发的显示存储技术GDDR6X,支持PAM4信令,提供760GB/s的超高带宽,可以将存储在英伟达芯片中的数据量增加一倍,达到24GB。c7REETC-电子工程专辑

c7REETC-电子工程专辑

 “与传统内存不同,GDDR6X具有无可比拟的数据速率,可以跟上游戏创新和数据密集型应用程序的步伐,”美光计算与网络业务部门高级副总裁兼总经理汤姆·埃比(Tom Eby)说。c7REETC-电子工程专辑

定制化的工艺,加上最新显存技术,让Ampere GPU对比上代 Turing,有着 1.9x Perf/W 的性能功耗增长。尽管三星 8 纳米可能已经不差,但与台积电 7 纳米相比,裸晶尺寸肯定较大,所以有散热方面的疑虑,而且这次RTX 30系列全线采用的美光显存,此前也传出有相关问题。c7REETC-电子工程专辑

c7REETC-电子工程专辑

上市时间

最后,英伟达表示,GeForce RTX 3080将于9月17日上市,RTX 3090将于9月24日上市,而RTX 3070将在10月份的某个时候上市。在英伟达的第三财季于10月底结束之前,该公司将有大约6周的时间来销售新显卡。c7REETC-电子工程专辑

截至当地时间周二美股收盘,英伟达股价上涨3.37%,报收于552.84美元,这是该股连续第三天创下历史新高。今年以来,该公司股价累计飙升135%。c7REETC-电子工程专辑

责编:Luffy Liuc7REETC-电子工程专辑

本文综合自Nvidia官网、新浪科技、瘾科技、Techweb、xfastest、cnBeta报道c7REETC-电子工程专辑

ASPENCORE
本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 什么是SmartNIC?六大厂商的SmartNIC有何不同? 普通NIC定位于高效迁移服务器的网络数据包,通常包括不同程度的为优化性能而设计的传统卸载。SmartNIC整合了多方面的附加计算资源,但是这些架构就像雪花一样各不相同,因此,我们将深入研究规模最大、最受欢迎的供应商所提供的几种方法。
  • 2020第二季全球前十大IC设计厂商排名出炉,博通近40亿夺 据集邦咨询最新统计,全球前十大IC设计业者2020年第二季营收及排名出炉,高通(Qualcomm)虽持续受惠于5G产品、远距工作与教学需求,然而,因苹果(Apple)新一代iPhone确定延期上市,导致其第二季营收成长动能受限,进而让博通(Broadcom)抢下本季营收排行榜冠军。
  • 如何优化边缘机器学习的功耗和性能 知名市场研究和咨询机构 Tractica近日针对“深度学习芯片组”进行了分析和预测,报告结果显示,机器学习 (ML) 算法正被广泛运用于训练神经网络的企业云系统,而诸如汽车、无人机和移动设备等边缘设备的 AI/ML 芯片组更是以三位数的速度持续增长(图 1)。AI/ML已然成为这些领域欲发挥价值的关键因素。
  • 如何验证复杂的RISC-V设计 随着RISC-V处理器开发渐趋成熟,以及SoC和微控制器中RISC-V内核使用量的不断增加,工程团队面临着新的验证挑战。为使RISC-V内核标准化,业界的验证工作均集中在ISA的合规性上。但现在问题似乎演变成,如何随系统的不断发展进行验证?
  • 详解FPGA如何实现FP16格式点积级联运算 通过使用Achronix Speedster7t FPGA中的机器学习加速器MLP72,开发人员可以轻松选择浮点/定点格式和多种位宽,或快速应用块浮点,并通过内部级联可以达到理想性能。
  • 二代IPU:怎样做一颗秒杀超算的芯片? 近期Graphcore又发布了二代IPU芯片Colossus MK2 IPU (GC200)(以下简称MK2),以及包含四颗MK2芯片系统方案的IPU-Machine: M2000 (IPU-M2000)(以下简称M2000)。扩展至1024个IPU-POD,即512个机架,至多64000个MK2芯片集群之后,其16bit FP算力能够达到16 ExaFLOPs.
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了