8月底,美国政府命令NVIDIA及AMD停止向中国大陆、中国香港和俄罗斯销售部分高性能GPU,其中就包括NVIDIA的A100 和 H100。经过与美国政府的斡旋,NVIDIA声明已获得1年的出货许可,但为了应对市场和出口管制政策的不确定因素,NVIDIA也要在这1年内尽可能多地出货,以满足客户“囤货”的需求……

9月19日,据中国台湾《经济日报》报道,全球GPU龙头英伟达近期对台积电下了“超级急件(super hot runs)”订单,以提前生产原计划明年出货的部分产品。传闻称,这批“超级急件”涉及5000片晶圆产能,相关产品的交期将大幅缩短,从原本预估的5-6个月,压缩至2-3个月,台积电最快将在10月底至11月初向英伟达开始交货。

9 月 20 日 ,NVIDIA 在GTC  2022上宣布 NVIDIA H100 Tensor Core GPU 全面投产,也算是对上述传闻的官宣了。

为什么这么着急?皆因在8月底,美国政府命令NVIDIA及AMD停止向中国大陆、中国香港和俄罗斯销售部分高性能GPU,其中就包括NVIDIA的A100 和 H100。美国政府表示,这是为了防止这些产品被用于“军事最终用途”或“军事最终用户”。

美国证监会文件

对此,NVIDIA与美国政府展开了积极斡旋,很快在9月1日,他们公告声明已获得美国政府批准,可以在明年3月前继续向美国客户出口(到中国)的产品提供A100,可以在明年9月前继续履行A100和H100的订单。

根据声明,NVIDIA获得美国政府的授权包括三点:

1、授权NVIDIA继续开发H100芯片所需的出口、再出口和国内转移;

2、授权允许NVIDIA在2023年3月1日前进行必要的出口以向A100的美国客户提供支持;

3、授权NVIDIA在2023年9月1日之前通过其香港办事处履行A100和H100订单和物流。

可见考虑到中国是NVIDIA和AMD最重要的市场之一,美国政府决定给予禁售令最多1年的宽限期。而为了应对市场和出口管制政策的不确定因素,NVIDIA也要在这1年内尽可能多地保障客户长期需求,所以向台积电下“超级急件”订单,早些生产出明年出货的量,满足市场客户“囤货”的需求。

H100能用来做什么?

GPU是计算机图形显示的核心,相比CPU更适合于密集型数据处理,具有高度并行性,可将数学运算应用于高度并行的数据集。虽然CPU也可以执行相同的任务,但不具备GPU的并行性,因此在这些任务中效率不高。

在这个算力为王的时代,GPU的应用场景主要是加速智能制造下的数字化转型。深度神经网络、数据分析、可视化、互联网推荐算法、数字孪生等均离不开GPU。除游戏主机与PC之外,其终端应用还包括服务器、汽车、移动等领域。

北京半导体行业协会副秘书长朱晶表示,被封锁的产品是有足够双精度计算能力的高端GPU,对于低端GPU不受影响。具备较高双精度计算能力的高端GPU主要用于高性能计算领域,包括科学计算,CAE(计算机辅助工程),医疗等方面。

朱晶认为,这次高端GPU禁售的打击方式是从“超算相关单位进入实体清单”升级为“可为超算提供服务的相关产品直接禁售”, 导致受影响的范围从超算领域扩大到互联网领域。目前,国内能替代英伟达H100这类GPU的产品几乎没有。

资料显示,H100 于 2022 年 4 月发布,由 800 亿个晶体管组成,并采用了众多开创性的技术,包括全新的 Transformer 引擎和 NVIDIA NVLink® 互连技术,以加速最大规模的 AI 模型,如高级推荐系统和大型语言模型,并推动对话式 AI 和药物发现等领域的创新。

NVIDIA 创始人兼首席执行官黄仁勋表示: “Hopper 是 AI 工厂的全新引擎。它能够处理和挖掘海量数据,训练具有数万亿参数的模型,这些模型将推动基于语言的 AI、机器人、医疗和生命科学领域的进步。Hopper 的 Transformer 引擎将性能提升了一个数量级,使大规模 AI和 HPC 能够为企业和研究人员所用。”

除了 Hopper 的架构和 Transformer 引擎之外,第二代多实例 GPU、机密计算、第四代 NVIDIA NVLink 和 DPX 指令等若干关键性创新也让 H100 GPU 如虎添翼,实现了 NVIDIA 加速计算数据中心平台的又一次飞跃。

用于主流服务器的 H100 现包含为期五年的 NVIDIA AI Enterprise 软件套件许可。这将优化 AI 工作流的开发和部署,确保用户能够获得构建 AI 聊天机器人、推荐引擎、视觉 AI 等所需的 AI 框架和工具。

NVIDIA 在GTC 2022上表示,全球技术合作伙伴计划于 10 月推出首批基于开创性 NVIDIA Hopper™ 架构的产品和服务。

Hopper 的全球推广

H100 使企业能够削减 AI 的部署成本,相较于上一代,在提供相同 AI 性能的情况下,可将能效提高 3.5 倍,总体拥有成本减少至 1/3,所使用的服务器节点数也减少至 1/5。

对于有意立即尝试这项新技术的客户,NVIDIA 已宣布戴尔 PowerEdge 服务器上的 H100 现可在 NVIDIA LaunchPad 上使用。NVIDIA LaunchPad 为企业提供免费的动手实操实验室,让企业能够接触到最新的硬件和 NVIDIA AI 软件。

NVIDIA DGX™ H100 系统现在也已开始接受客户预定。该系统包含 8 个 H100 GPU,FP8 精度的峰值性能达到 32 PFlops。每个 DGX 系统都包含 NVIDIA Base Command™ 和 NVIDIA AI Enterprise 软件,可实现从单一节点到 NVIDIA DGX SuperPOD™ 的集群部署,为大型语言模型和其他大规模工作负载的高级 AI 开发工作提供支持。

头部计算机制造商所提供的搭载 H100 的系统预计将在未来几周内发货,到今年年底将有超过 50 款服务器型号面市,2023 年上半年还将有数十款型号面市。已在构建系统的合作伙伴包括源讯(Atos)、思科、戴尔科技、富士通、技嘉科技、慧与、联想和超微。

此外,数家全球领先的高等教育和研究机构的新一代超级计算机也将采用 H100。其中包括巴塞罗那超级计算中心、洛斯阿拉莫斯国家实验室、瑞士国家超级计算中心(CSCS)、德州高级计算中心和筑波大学。

H100 走向云端

AWS、谷歌云、Microsoft Azure、Oracle Cloud Infrastructure 将从明年开始率先在云端部署基于 H100 的实例。

Microsoft Azure AI 基础设施总经理 Nidhi Chappell 表示: “我们期待着在 Microsoft Azure的最新 H100 GPU 上实现下一代 AI 模型。借助 Hopper 架构的进步,加之我们在 Azure AI 超级计算方面的投资,我们将能够助力加速全球 AI 的发展。”

Oracle Cloud Infrastructure 产品管理副总裁 Karan Batta 表示: “我们通过为客户提供 NVIDIA 最新的 H100 GPU,帮助他们加速最为复杂的机器学习和 HPC 工作负载。另外,凭借 NVIDIA 的新一代 H100 GPU,我们能够为内部要求严苛的工作负载提供支持,并助力我们共同的客户在医疗、自动驾驶汽车、机器人和物联网领域取得突破。”

NVIDIA 的软件支持

 H100 先进的 Transformer 引擎技术可助力企业快速开发精度更高的大型语言模型。随着这些模型的规模不断扩大,其复杂性也在不断提升,有些模型的训练时间甚至长达数月。

为解决这一问题,一些全球领先的大型语言模型和深度学习框架正在 H100 上进行优化,包括 NVIDIA NeMo Megatron、Microsoft DeepSpeed、Google JAX、PyTorch、TensorFlow和XLA。这些框架与 Hopper 架构相结合,能够显著提升 AI 性能,将大型语言模型的训练时间缩短到几天乃至几小时。

责编:Luffy
阅读全文,请先
您可能感兴趣
随着以ARM为代表的半导体企业被外资收购成为事实,不仅让英国半导体产业大受损失,而且也给特拉斯新政府带来了进一步压力。特拉斯新政府需要证明英国有能力阻止本国科技公司被别国公司收购,同时以此对外展示伦敦仍然是全球重要的金融中心的重要地位。
“数字时代的关键资源是数据、算力和算法,其中数据是新生产资料,算力是新生产力,算法是新生产关系,三者构成数字经济时代最基本的生产基石”。亿铸科技聚焦国产存算一体AI大算力芯片,28纳米工艺实现10倍能效比。
如今,作为第三代半导体的宽带隙器件,氮化镓半导体技术已广为熟知。凭借其良好的CMOS兼容能力,GaN工艺可能实现高频、高功率GaN器件与高密度存储和数字逻辑电路的高度集成,从而推动包含射频收发器、现场可编程门阵列、处理器和存储器等功能的高频大功率系统级芯片的构建与实现。
对于Arm这个核心科技资产,即使是“老铁”美国,英国预计也会出面干预的。那么,三星意欲收购ARM的计划,预计也可能性不大。
今年初,Mikron准备了一个投资项目,计划将产能扩大两倍(每月达6000片),用于生产180-90nm的芯片。为了实施这一项目,该公司需要大约100亿卢布。因此,俄罗斯此次给予70亿卢布的资金支持,将极大缓解Mikron扩产的资金压力。
手机拍照的影响力尽人皆知。随着手机摄像技术的不断进步以及AI的参与,图像处理器(ISP)的性能也变得更高,再加上“计算摄影”和“趣味摄影”技术的发展,ISP技术有了更大的外延,在链条上的话语权显著提升。根据手机拍照图像技术的演进路线,本文透彻分析了独立ISP的成因及优缺点,以及本土手机厂商自研独立ISP的意义。
由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。

芯和半导体Metis 是一款定位于先进封装仿真的快速电磁场仿真工具,它提供了与芯片设计工具和封装设计工具的便捷集成,满足先进封装设计中对于容量、精度和吞吐量方面的严苛要求。
Qorvo小巧紧凑的集成式前端模块 (iFEM)QPF7250为Wi-Fi 6 (802.11ax) 及最终的Wi-Fi 7系统提供高效可靠的全屋覆盖。相比竞争产品,QPF7250将Wi-Fi范围扩大了30%,同时增加了容量,以支持智能家居和物联网的更多接入点。
电子万花筒平台核心服务 中国最活跃的射频微波天线雷达微信技术群电子猎头:帮助电子工程师实现人生价值! 电子元器件:价格比您现有供应商最少降低10%射频微波天线新产品新技术发布平台:让更多优秀的国产射频
直流12V电机转速控制电路利用这种电路可以控制小汽车内的12V直流风扇转速。电路主要元器件为555定时器.它连接成振荡器工作模式。振荡器的输出连接至场效应管 IRF540(T1),风扇则连接在T1的漏
微信搜一搜技成培训威纶通触摸屏支持串口、网口、U盘上下载画面,网口上下载方法前期已和大家分享过,网口也是最常用的,如若说紧急情况,不能使用网口或串口上下载时,想要读取或下载画面就必须采用U盘功能,说到
微信搜一搜技成培训免责声明:本文转自网络,版权归原作者所有,如涉及作品版权问题,请及时与我们联系删除,谢谢!HISTORY/往期推荐2021年电工初级考试题库完整版(内含答案)变频器故障查询检修难?只
随着科技迭代更新速度加快,绿色经济和智能化新概念已被广为所知,越来越多的电动汽车和智能产品已出现在人们的日常生活中,这也非常考验厂商的研发速度,在研发过程中,锂离子电池管理系统(BMS)往往是项目的核
2.5.1  General选项卡General选项卡包含Altium Designer原理图的一些常规设置。在系统参数设置窗口中找到“Schematic-General”选项卡,出现如图2-20所示
关注我们更多精彩等你发现!点击下方“阅读原文”进行网申END往期精选   【免费】FPGA工程师招聘平台简谈FPGA设计中系统运行频率计算方法与组合逻辑的层级SANXIN-B01开发板verilog教
9月20日消息,据国外媒体报道,昨日,苹果分析师郭明錤(Ming-Chi Kuo)表示,由于iPhone 14 Pro机型需求强劲,苹果已要求其生产伙伴鸿海增加该机型的产量。他表示,苹果已要求鸿海将i
2022年,华南国际智能制造、先进电子及激光技术博览会(简称LEAP Expo)旗下成员展慕尼黑华南电子生产设备展重新定档,将于11月16-18日,再次登陆深圳国际会展中心(宝安新馆),本次LEAP
题记1. 用户对手机的需求层次2. 稳定性3. 续航3.3.1 控制应用启动3.3.2 控制后台进程运行3.3.3 待机功耗优化3.3.1 基础功耗3.1 更快的充电3.2 更慢的耗电3.3 待机功耗