广告

全球最快超级计算机们都采用什么加速技术?

时间:2021-11-17 作者:NVIDIA 阅读:
随着最新一代超级计算机日益与人工智能和云计算相结合,衡量这些机器的方式也在发生变化。在本周SC21高性能计算大会上最新发布的TOP500榜单上,NVIDIA技术为355套超级计算机系统提供加速,占榜单的70%以上……
广告

从科学模拟、可视化、数据分析再到机器学习,各种现代计算的工作负载正在推动超级计算中心、云服务提供商和企业重新思考他们的计算架构。

仅靠处理器、网络或软件优化已经无法满足研究人员、工程师和数据科学家的最新需求。

数据中心取而代之,成为新的计算单元,因此企业必须关注整个技术堆栈。

全球最强系统的最新排名显示,在新一代超级计算机中,这种使用全栈方法的趋势还在持续。

在本周SC21高性能计算大会上最新发布的TOP500榜单上,NVIDIA技术为355套超级计算机系统提供加速,占榜单的70%以上,而新增系统中90% 以上都采用了NVIDIA 的技术。对比6月份发布的TOP500榜单上342个系统(占榜单68%)使用NVIDIA技术,增长趋势明显。

NVIDIA在全球最节能系统Green500榜单上也继续保持领先优势,占据了榜单排名前25名系统中的23套,与6月份持平。平均来看,采用NVIDIA GPU的系统能耗效率比非GPU系统高3.5倍。

来自微软的GPU加速Azure超级计算机在榜单上排名第十。这是基于云的系统首次跻身前10名,新一代云原生系统就此崭露头角。

人工智能正带来一场科学计算的革命。近年来,研究高性能计算和机器学习的论文数量激增,从2018年的约600篇增长到2020年的近5000篇。

包括HPL-AI和MLPerf HPC在内的新基准也强调了高性能计算和AI工作负载的持续融合。

作为一个融合了高性能计算和人工智能工作负载的新基准,HPL-AI使用了深度学习和许多科学与商业工作的基础——混合精度计算,同时还提供高性能计算基准传统的标准标尺——双精度计算的高度准确性。

MLPerf HPC基准适用于通过人工智能实现超级计算机模拟加速和增强的计算方式,主要被用来测试高性能计算中心天体物理学(Cosmoflow)、天气(Deepcam)和分子动力学(Opencatalyst)三大关键工作负载的性能表现。

NVIDIA通过GPU加速处理、智能网络、GPU优化应用程序和支持AI和高性能计算融合的库来解决整个堆栈的问题。这一方法提升了工作负载的性能表现,并推动了科学突破。

让我们来具体看一看NVIDIA是如何助力超级计算机实现性能提升的。

加速计算

GPU的并行处理能力再加上超过2500个GPU优化应用程序,在多数情况下可以让用户把高性能计算任务的时间从几周减少到几个小时。

NVIDIA一直在优化CUDA-X库和GPU加速应用程序,所以用户如果发现自己的GPU架构性能突然有了提升也很正常。

因此,应用范围最广的科学应用程序(我们称之为“黄金套件”)的性能在过去6年里提高了16倍,而且还在不断提升。

图注:全栈创新带来顶级高性能计算、人工智能和机器学习应用程序的16倍性能提升。

为帮助用户快速提升性能,NVIDIA通过NGC目录中的容器提供最新版本的人工智能和高性能计算软件。用户只需在数据中心或云端的超级计算机上拖拽并运行应用程序即可。

高性能计算与人工智能融合

人工智能在高性能计算中的应用能帮助研究人员加快模拟速度,同时保持传统模拟方法的准确性。

为此,越来越多的研究人员开始利用人工智能来加快研究的速度,比如今年超算领域最有声望的戈登·贝尔奖(Gordon Bell prize决赛的四组晋级团队。各大企业正在竞相建造E级人工智能计算机,以支持这种融合高性能计算和人工智能的新模式。

一些相对较新的基准(如HPL-AI和MLPerf HPC)也印证了这一趋势,强调了高性能计算和AI工作负载的持续融合。

为推动这一趋势,上周NVIDIA推出了一系列用于高性能计算的先进的新的库和软件开发工具套件。

图是现代数据科学中的一个关键数据结构。通过一个名为深度图库(DGL)的新型Python包,用户现在可以把图投影到深度神经网络框架中。

NVIDIA Modulus构建并训练了一个内嵌物理信息的机器学习模型,可以用来学习并遵循物理定律。

NVIDIA推出了三个新库:

  • ReOpt – 可提高规模高达10万亿美元的物流行业的运营效率。
  • cuQuantum – 可加速量子计算研究。
  • cuNumeric – 为Python社区的科学家、数据科学家、机器学习和人工智能研究人员加速NumPy。

NVIDIA的虚拟世界模拟和3D工作流协作平台NVIDIA Omniverse负责把一切整合到一起。

Omniverse可用来模拟仓库、工厂、物理和生物系统、5G边缘、机器人、自动驾驶汽车甚至是虚拟形象的数字孪生。

NVIDIA上周宣布,将利用Omniverse构建一台名为Earth-2的超级计算机,通过创建一个数字孪生地球来预测气候变化。

云原生超级计算

随着超级计算机在数据分析、人工智能、模拟和可视化方面承担越来越多的工作负载,CPU不得不在大型复杂的系统上支持更多的通信任务。

DPU(数据处理器)可以卸载多种操作,有效减轻这一压力。

作为一个完全集成的片上数据中心平台,NVIDIA BlueField DPU可以卸载和管理数据中心的基础设施任务,释放主机的处理器资源,从而实现更强的安全性和更高效的超级计算编排工作。

与NVIDIA Quantum InfiniBand平台相结合,该架构可提供最佳裸机性能,同时原生支持多节点租户隔离。

NVIDIA的Quantum InfiniBand平台提供可预测的裸机性能隔离。并且采用零信任安全防护,因而这些新系统也更加安全。

BlueField DPU将用户应用与基础设施任务隔离开来。最新的BlueField软件平台NVIDIA DOCA 1.2支持下一代分布式防火墙和更广泛的线速数据加密。而NVIDIA Morpheus则会假设入侵者已经进入数据中心,将利用基于深度学习的数据科学来实时检测入侵者的活动。

新的网络技术则会加速上述这些趋势场景。

上周NVIDIA还发布了NVIDIA Quantum-2。这是一个400Gbps InfiniBand平台,由Quantum-2交换机、ConnectX-7网卡、BlueField-3 DPU以及用于新网络架构的软件组成。

NVIDIA Quantum-2提供了裸机高性能和安全多租户优势,可以让下一代超级计算机实现安全性、云原生以及更高的效率。

**基准应用AmberChromaGROMACSMILCNAMDPyTorchQuantum Espresso;

Random Forest FP32TensorFlowVASP | GPU节点双插槽CPU4P100V100A100 GPU

责编:Luffy Liu

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 论CPU核心数,为什么Intel会干不过AMD? AMD给自家处理器堆了这么多核心,Intel为什么不也这么干呢?偏要等到今年出了混合架构,才开始通过E-core堆出更多核心?很多同学首先想到的,应该是Intel工艺暂时落后于台积电的事实。这的确是一个因素,更大线宽的工艺,堆起核心来自然要耗费更多的芯片面积——也就是成本;而且对功耗也相当的不利。但实际上还有一些架构层面的原因,是相关于核心之间的连接方式的。
  • 传高通、AMD将率先采用三星2022年上半量产的3nm芯片制 11月22日消息,据外媒援引韩国业界人士消息指出,三星晶圆代工部门计划2022年上半年量产的第一代3nm制程,首发客户有望包涵高通以及AMD两大厂,同时自家三星电子Exynos下半年将亮相的芯片也将采用该制程。
  • IC Insights :2021全球半导体市场增长23%,盘点Top25企业 近日,市场研究及调查机构《IC Insights》最新研究报告公布了按销售增长率排名的前25家半导体供应商的预计排名。虽然新冠疫情影响全球半导体产业,不过 2021 年却出现意外大好,预计 2021 年全球半导体市场将增长 23%,半导体单位出货量强劲增长20%,半导体平均销售价格预计增长 3%。 23%市场增长将是自2010 年以来全球半导体市场的最大涨幅,曾在2008年和2009年金融危机和全球经济衰退后,全球半导体销售额飙升了34%。
  • 2021-2026年全球企业服务预测:到2026年市场规模达3万亿 Omdia预计,经济形势将逐渐从疫情阴影中走出来,从而推动未来5年全球企业服务支出加速增长。不过,各个地区和行业的复苏速度各不相同。所有企业的IT决策者愈发意识到对数字化转型进行投资的必要性,其中往往包括各种企业服务和新兴技术。虽然这种投资在某种程度上取决于企业分配的总体IT预算规模,但从长远的角度出发,企业也可能在经济困难时期增加服务预算来提高稳健性、灵活性和竞争优势。
  • DDR5内存还未普及,DDR6已经在路上了 DDR5预计会在2022年开始全面普及,普及将需要2-3年左右的时间。然而,三星研发的DDR6内存已经在路上,GDDR7显存也不远了。
  • 芯动科技首款国产高性能服务器级显卡GPU -- “风华1号 芯动科技潜心为5G数据中心定制的高性能显卡GPU芯片——“风华1号”回片测试成功。“风华1号”采用GDDR6X和chiplet技术,实现了数据中心国产高性能图形GPU零的突破,大幅提升了国产GPU图形渲染能力。
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。

  • 储能与电动汽车应用爆发下,安全可靠 随着汽车设计转向电气化,以及风能和太阳能等可再生能源的部署速度加快,并不断与新推出的储能和电池技术融合。高功率电子成为电池系统的关键部件。这些电子需要与低压数字控制器通信并由其控制,如何实现安全迅速的接口通信是设计可靠电池管理系统的一大挑战。
  • 中国芯应用创新32强出击,众多奖项花 11月16日,第三届IAIC中国芯应用创新设计大赛决赛在深圳前海举行,大赛组委会邀请了来自兆易创新、华大半导体等原厂专家、来自旦恩资本、一本基金、深创投等资深投资机构以及来自中电港、中科院深圳先进院、深半协、深圳中微电、健天电子、史河机器人科技、亚力盛等行业专家作为决赛的评委专家组。
  • 台积电首度表态声援光洋科!期盼尽快平息争议稳定运营 靶材大厂光洋科爆发经营权之争,继联电、南茂、稳懋等客户后,台积电今日也首度表态声援,强调由马坚勇带领的技术团队正与台积电进行多项技术合作,期望光洋科能持续提供稳定的供应服务,快平息并回归正常及稳定运营
  • 苹果预计明年底推出AR设备,有望搭载索尼4K Micro OLED显示屏 来源 :驱动之家11月26日消息,天风国际分析师郭明錤发布最新研报称,苹果将在2022年Q4推出AR头戴设备,采用运算能力和Mac同等级的处理器。郭明錤表示,除了Mac同等级的性能外,苹果A
  • 【旧文回顾】深度揭秘,阻抗测试那些你所不知道的内幕 公众号:高速先生作者:周伟最近,新晋级的SI攻城狮雷豹运气有点霉,刚刚经受了Pin delay的折磨,现在又碰到一个怪异的事情,某客户产品性能有问题,经多次排查后,发现板内阻抗测试结果不达标,但是板厂
  • 近1000万元!山东天岳等发起碳化硅招标 近日,山东天岳、中电化合物半导体和季华实验室对外发布了碳化硅设备等采购招标需求,合计金额近1000万元。山东天岳招标11月24日,天岳先进科技对外发布了“110kV输变电工程清河站天岳站高压外线接入工
  • 销量横扫!中国内存/SSD大厂获数亿B轮融资 11月26日最新消息,近日,深圳市嘉合劲威电子科技有限公司完成数亿元B轮融资,投资方包括招银国际、中信建投、易方达、高新投等。本轮融资资金主要用于技术研发、提升智能制造。同时,嘉合劲威即将启动B+轮融
  • 维信诺发布日常经营重大合同公告:获荣耀订单累计超22亿 11月26日晚,维信诺(002387.SZ)发布日常经营重大合同公告。截至本公告披露日,公司连续十二个月与荣耀终端签署的日常经营类订单金额累计达到224,850.70万元,占公司2020年经审计主营业
  • 特斯拉 | 总投资12亿元!上海工厂再度扩产,明年4月完工 来源 :新京报11月26日,从上海企事业单位环境信息公开平台获悉,特斯拉对上海超级工厂(一期)第二阶段的产线优化项目进行环评公示。环评报告显示,该产线优化项目投资总额高达12亿元人民币,其中
  • 做AGV 20年,机科有话说 机科如何定位自身,又如何理解行业?文|新战略作为国内最早一批入局AGV行业的企业,机科早在1999年便开始智能输送装备相关情况调研,2002年,由“机械科学研究院”相关研究所转制正式成立“机科发展股份
  • 极智嘉携手九州通打造全球首个AMR月台集货项目! 创新型、高效率、智能化!文|极智嘉全球AMR引领者极智嘉(Geek+)携手医药龙头企业九州通成功落地全球首个AMR月台集货。通过跨楼层、跨库区的综合性解决方案,极智嘉在九州通郑州物流中心近万平场地部署
  • 信利 | 投资200亿!信利第六代TFT-LCD生产线项目签约汕尾 来源 :南方+日前结束的第二届汕尾市发展大会上,汕尾市高新共签约项目8个,总投资253.5亿元。这些项目分别为信利第六代TFT-LCD生产线、康冠平板显示终端产品研发与生产、名仕度高强高模聚
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了