广告

英伟达对决英特尔:Arm服务器CPU挑战至强处理器,AV芯片PK Mobileye

时间:2021-04-13 作者:ASPENCORE全球编辑群 阅读:
在全球服务器CPU市场,Intel拥有超过90%的份额。英伟达与Arm联合开发的Arm架构服务器CPU Grace能否对抗英特尔至强处理器?英伟达最高性能的自动驾驶平台DRIVE Hyperion 8和AV芯片DRIVE Atlan能否胜过英特尔旗下的Mobileye?
广告
电子工程专辑 EE Times China -提供有关电子工程及电子设计的最新资讯和科技趋势

上周,英特尔发布采用其10nm工艺的第三代至强可扩展处理器Ice Lake。本周一,被英特尔收购的以色列自动驾驶芯片公司Mobileye宣布与自动驾驶(AV)初创公司Udelv 合作,采用其EyeQ 5芯片和全栈AV系统平台开发无人驾驶货运车Transporters。

同样在本周一,英伟达发布基于Arm架构的数据中心处理器Grace,同时发布自动驾驶(AV)平台DRIVE Hyperion 8和AV芯片DRIVE Atlan(号称性能高达1000TOPS)。

在服务器CPU市场,Intel拥有超过90%的份额,AMD霄龙系列服务器CPU始终无法撼动Intel的地位。英伟达与Arm联合开发的Grace能否对抗英特尔?英伟达最高性能的自动驾驶芯片和平台能否胜过英特尔旗下的Mobileye?

在全球两大最高性能计算和最热门需求的市场上—数据中心和自动驾驶,英伟达开始正面对决英特尔。多年生活在英特尔阴影下的英伟达这次能否与英特尔平分秋色,称霸全球高性能计算(HPC)市场?在回答这个问题之前,让我们先看看两家公司各自的“当家武器”。

英伟达AV平台Hyperion 8和AV芯片DRIVE Atlan

英伟达CEO黄仁勋在GTU虚拟大会上宣布了DRIVE Atlan,这款计划2025年量产的下一代DRIVE SoC将提供高达1,000 TOPS的性能,集成有CPU、GPU和深度学习加速器(DLA),并为下一代AV提供最新的网络和安全性。

Nvidia自动驾驶芯片DRIVE Atlan。 (来源: Nvidia)

英伟达同时发布了自动驾驶开发平台DRIVE Hyperion 8,以及数字孪生仿真工具DRIVE Sim。该公司声称已经签署价值80亿美元的汽车合作开发协议,合作伙伴包括沃尔沃汽车、奔驰、蔚来、上汽、TuSimple、Zoox、Cruise、法拉第未来和VinFast等公司传统车厂及造车新势力。

DRIVE Hyperion 8 AV平台可以支持数据采集、AV开发和测试。(来源: Nvidia)

在英伟达发布的所有技术和产品中,EETimes汽车专栏作家和资深汽车行业分析师Egil Juliussen认为Hyperion 8可能是最有价值的。这个AV开发平台可能吸引更多汽车OEM厂商、自动驾驶初创公司和运输公司因为它可以极大地简化AV系统设计流程,并为未来产品的开发铺平道路。这类似于IC设计行业的开发系统,或者基于AI的自动驾驶行业的云计算平台。在主题演讲中,黄仁勋确实提到了分别与亚马逊AWS和Google Cloud达成的合作协议。

Drive Atlan展示出英伟达基于GPU持续提升其自动驾驶SoC的一贯做法,但Linley调研公司高级分析师Mike Demler注意到,英伟达似乎越来越早地宣布其未来处理器产品,这难道是让业界和竞争对手毫无喘息之力吗?Orin都还没有量产,他们现在又发布了下一代产品Atlan。Atlan原理图和1,000 TOPS性能规格可能只是顶层设计目标罢了。

Nvidia的DRIVE SoC规划图。(Source: Nvidia)

Mike Demler提出质疑,采用320 TOPS Xavier的Drive Pegasus是L5系统,然后Orin升级到400 TOP,现在Atlan更是跃升至1000 TOPS?英特尔旗下的Mobileye提供的同类AV芯片大约是“ TOPS”性能评级的1/10,而功耗却低得多,显然TOPS不是一个可靠的衡量标准。他补充道,赢得奔驰和沃尔沃的设计是很不错的,但是不到量产阶段就毫无意义。

Juliussen也表示认同,1,000 TOPS固然很好,但这几乎不可能达到。他认为TOPS应该代表极度乐观的处理器速度(Totally Optimistic Processor Speed),加上功耗才有意义。

Demler还对Atlan的SoC架构提出了质疑,英伟达希望Atlan一颗芯片就能集成仪表盘、信息娱乐、ADAS/AV、驾驶员监控(DMS),以及网络网关等全部汽车驾驶功能。在英伟达看来,汽车就是有轮子的服务器。但是,与数据中心不同的是,自动驾驶汽车没有无限的电力供应。现在尚不清楚将所有这些功能都集成在一块芯片上是否最好的方法,尽管英伟达会推出一系列Atlan芯片。

Mobileye采取系统级AV策略

英伟达如何领先汽车市场?凭借其完善的生态系统(硬件、软件和AI模型),以及性能不断提升的SoC。而Mobileye则采取系统级AV策略,其秘密武器是“真正的冗余(true redundancy)”。

与Mobileye合作的AV初创公司Udelv计划到2028年生产3.5万辆Transporter无人驾驶货运车,均采用Mobileye的全栈自动驾驶系统。据Udelv联合创始人兼CEO Daniel Laury称,他们最初采用百度的Apollo平台,但最终还是选择了Mobileye,主要是看重后者的“冗余自动驾驶”功能,因为这是“真正的冗余”。Mobileye还采用了一种独特的方法,将传感器分离为两个通道-一个用于摄像头,另一个用于雷达和激光雷达。其理念是让每个通道独立地证明各自的安全性,然后在将两个通道融合。相比之下,竞争对手的方法是部署互补性传感器,即从一开始就将它们融合在一起,以创建一个单一的模型。

Udelv的Transporter无人驾驶货运车采用Mobileye全栈自动驾驶系统。(来源: Udelv)

Udelv还喜欢Mobileye“道路体验管理”(REM)众包地图方案,可以支持广泛的地图覆盖范围。 Mobileye声称,他们每天可以绘制超过800万公里的道路,而且已经绘制了将近10亿公里的道路。该公司预计到2024年,每天可以绘制100万公里的地图。

英特尔至强Xeon处理器通吃云端、网络和智能边缘

据英特尔宣传,与前一代产品相比,最新的第三代至强可扩展处理器在主流数据中心工作负载上性能平均提升46%,同时增加了针对AI加速的深度学习加速技术(DL Boost)。采用10nm工艺的至强可扩展处理器可以加速云端、人工智能、企业端、高性能计算、网络、安全和边缘应用上的部署。

英特尔执行副总裁兼数据平台事业部总经理Navin Shenoy发布第三代英特尔至强可扩展处理器。(来源:Intel)

据英特尔2021年第一季度业绩显示,该处理器出货量已经超过20万颗。其中,全球范围内大型的云服务提供商即将部署服务,在50个独立OxM合作伙伴中有超过250个基于该处理器的设计,超过20个高性能计算(HPC)实验室和HPC即服务环境正在利用全新至强可扩展处理器。

英伟达基于 Arm 架构的数据中心 CPU 处理器“Grace”

在GTC2021大会上,英伟达 发布其首款基于 Arm 架构的数据中心 CPU 处理器“Grace”,在最复杂的 AI和高性能计算工作负载下,可实现 10 倍于当今最快服务器的超高性能。

分析认为,英伟达此举是直接挑战英特尔在服务器和数据中心计算领域的主导地位,因为发布会后,英特尔和AMD的股价应声下跌了几个百分点。

 

 

为什么要做这款CPU?

英伟达认为,AI模型的数据量和规模正在成倍增长。当今最大的AI模型包括数十亿个参数,并且每两个半月就会翻一番。训练它们需要一个新的CPU,可以与GPU紧密结合,以消除系统瓶颈。

英伟达创始人兼首席执行官黄仁勋表示,“NVIDIA Grace™ CPU 是超过10,000个工程年的成果,专为满足全球最先进应用的计算要求而设计。”—— 这些应用包括自然语言处理、推荐系统、AI 超级计算 —— 其所进行的海量数据分析需要超高速计算性能和大容量内存。

老黄仍然穿着他标志性的皮衣,在他们家标志性的厨房开着发布会。唯一的变化是头发长了,有人说“老黄这都是被缺货给愁的”

Grace这个名字来自美国海军少将、计算机编程先驱Grace Hopper。她是计算机科学的先驱之一,也是哈佛Mark 1的第一批程序员和第一个链接器的发明者。

Grace Hopper在20世纪50年代开创了计算机编程,发明了世界上第一个编译器,被称为“计算机软件工程第一夫人”。

这款CPU产品采用了Arm Neoverse核心,与低功耗内存子系统相结合,以高能效提供高性能。也有人认为,这英伟达是在收购Arm的关键时刻,英伟达表达诚意的一款作品。

“前沿的AI和数据科学正推动当今的计算机架构超越其极限,以处理规模难以想象的海量数据。NVIDIA 借助 Arm授权的 IP设计了 Grace,这是一款专为大规模AI和HPC设计的CPU。与GPU和DPU一起, Grace为我们提供了计算的第三种基础技术,以及为了推进AI发展重构数据中心的能力。NVIDIA现在是一家拥有三种芯片的公司。” 黄仁勋说到。

比 x86 CPU如何?

英伟达在新闻稿中描述,Grace是高度专业化的处理器,工作负载面向例如训练具有超过1万亿个参数的新一代NLP模型等。当与NVIDIA GPU紧密耦合时,搭载Grace CPU的系统速度比如今基于 NVIDIA DGX ™打造的最先进的系统(在 x86 CPU 上运行)快 10 倍。

在绝大多数数据中心由现有的CPU提供服务的同时,Grace将为计算的细分市场提供服务。

瑞士国家超级计算机中心 (CSCS) 和美国能源部洛斯阿拉莫斯国家实验室 (Los Alamos National Laboratory) 率先宣布计划构建搭载Grace的超级计算机,以支持国家科学研究工作。

NVIDIA推出Grace的背景是数据量和 AI 模型规模呈指数级增长。如今最大的 AI 模型包含数十亿个参数,并且参数数量每两个半月就会翻一番。训练这些模型需要一个与 GPU 紧密耦合的新 CPU,以消除系统瓶颈。

NVIDIA 利用 Arm 数据中心架构极大的灵活性构建了 Grace。通过推出新的服务器级 CPU,NVIDIA正在推进在AI和HPC领域中技术多样性的目标。在这些领域,更多选择是实现解决全球最迫切问题所需创新的关键。

 Arm 首席执行官 Simon Segars 表示:“作为全球授权范围最广的处理器架构,Arm 每天正在以不可思议的新方式推动创新。NVIDIA 推出Grace 数据中心 CPU 明确表明Arm的授权模式如何促进一项重要创新,这将进一步支持世界各地 AI 研究人员和科学家们非凡的工作。”

Grace 的首批使用者

CSCS 和洛斯阿拉莫斯国家实验室计划将于 2023 年推出由慧与Hewlett-Packard Enterprise构建的、搭载Grace的Alps系统。该系统采用新的 HPE Cray EX 超级计算机线以及 NVIDIA HGX 超级计算平台除了全新的Grace CPU包括 NVIDIA GPU 和 NVIDIA HPC SDK 。

CSCS 总监 Thomas Schulthess教授表示:“利用 NVIDIA 全新的 Grace CPU,使得我们能将 AI 技术和传统的超级计算融合在一起,来解决计算科学领域一些最难的问题。我们很高兴能够向我们的瑞士和全球用户提供这款全新 NVIDIA CPU,用于处理分析海量和复杂的科学数据集。”

洛斯阿拉莫斯国家实验室主任 Thom Mason 表示:“通过创新地平衡内存带宽和容量,新一代系统将重塑我们机构的计算策略。凭借 NVIDIA 全新 Grace CPU,我们可以在比以前更大的数据集上完成高逼真度3D仿真和分析,从而进行先进的科学研究工作。”

Alps 系是新一代超级计算机中的一将取代 CSCS 有的 Piz Daint 超级计算机新一代超级计算机利用 GPU 加速的深度学,将超级计展到传统的建模和模拟领域之外

Thomas Schulthess 表示:深度学只是我添加到工具箱中的一功能非常强大的工具而已。

Alps 利用 NVIDIA CPU 和 GPU 之密耦合,预计仅需两天就能训练出全球最大的自然理模型 GPT-3,比 NVIDIA 的 2.8-AI exaflops Selene 超级计算机快 7 倍Selene 超级计算机目前被 MLPerf 世界先的 AI 超级计算机

CSCS 用能够将种超强的 AI 性能广泛地用到从自然言理解中益的新兴科学研究例如,包括分析和理解科学文中提供的海量知,以及生成用于发现的新分子

实现性能突破

据英伟达方面资料,Grace基于第四代 NVIDIA NVLink® 互联技术,该技术在Grace和 NVIDIA GPU 之间提供创纪录的 900 GB/s 连接速度,使总带宽比当今领先的服务器高 30 倍。从CPU到CPU的速度超过600GB/s。

Grace 还将利用创新的 LPDDR5x 内存子系统,该子系统的带宽是 DDR4 内存的两倍,能效达 DDR4 的 10 倍。此外,新架构提供单一内存地址空间的缓存一致性,将系统和 HBM GPU 内存相结合,以简化可编程性。

Grace将获得 NVIDIA HPC软件开发套件以及全套 CUDA® 和 CUDA-X™ 库的支持,可以对 2,000 多个 GPU 应用程序加速,使得应对全球重大挑战的科学家和研究人员探索速度更快。

本文综合自:EE Times专栏文章Huang Harangue Heralds AV "Trillions" by Junko Yoshida

责编:Luffy Liu

电子工程专辑 EE Times China -提供有关电子工程及电子设计的最新资讯和科技趋势
本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
ASPENCORE全球编辑群
ASPENCORE 全球编辑国际化、本土化、专业深度的综合报道。
  • 2020 年全球出货1.51亿智能音箱,近半数采用联发科芯片 在2020年全球出货的1.51亿智能音箱和智能屏中,有近50%都在使用联发科的应用处理器。2020年联发科在智能音箱和屏幕市场的份额增长了六个百分点,过去两年的市场份额增加了一倍多……
  • 究竟是否应该选择授权互联IP?为什么? 我们最大的问题是哪些部分需要我们内部设计,哪些部分可以从外部引入?对于是否选择第三方提供的方案,针对不同IP在这个抉择上的争议程度有所不同。在本文中,我们要采用专为互联任务设计的网络来取代SoC的内部自建总线。
  • 比苹果M1更牛的芯片,明年高通可能要造出来了 苹果M1证明了Arm也能用来造高性能处理器,但并不意味着其他同在Arm阵营的企业有这种能力。和苹果存在直接竞争关系,且同在Arm阵营的,市场表现比较出色的应该就是高通了:无论是在手机处理器,还是在PC处理器上。
  • 低时延无线系统设计时,工程师都会考虑哪些因素? 无线通信网络的设计通常侧重考虑带宽、工作频率和时延等因素。本文将着重介绍实现低时延性能的设计考虑因素,特别是从设备首次接收到信号,到信号到达其最终目的地之间的时间如何实现最小化。
  • 2020年中国本土封装测试代工十强榜单 芯思想研究院日前发布2020年中国本土封测代工公司前十强排名,该榜单是继2019年发布之后 的第二次发布,得到了更多公司的支持。2020年中国本土封测公司前十强入围门槛为5亿元。 2020年中国本土封测代工公司前十强合计营收为525亿元,较2019年成长17%。前十强中,除华润微由于策略原因出现下滑外,其他9家公司都有不同程度的增长。
  • 看泛铨如何利用高阶3D X-ray与PFIB解析最新手机应用处 本次泛铨科技分析的目标是iPhone 12 Pro内搭载A14仿生(Bionic)应用处理(Application process, AP)芯片的芯片系统(System on chip, SoC),A14仿生应用处理芯片是由台积电最新的5纳米工艺节点所代工制造的。分析的流程为,先用最新高阶的3D X-ray将芯片系统的结构作非破坏高解析的全空间断层扫描 (Full-space tomography),了解其内部结构,接着再针对特定结构,利用具有大面积切削能力的PFIB,搭配自我研发的特殊工法与拍摄条件,清楚呈现InFO-PoP的内部结构。
  • Intel 11代酷睿1处理器正式发布:10 今晚,Intel发布的11带酷睿处理器采用10nm制程,面向高性能移动桌面版。同时发布的还有同样架构的至强W-11000系列,面向高性能移动工作站。
  • AMD RX 6600系列或配备8GB显存 MD的RX 6600系列可能配备的不是之前传闻的6或12GB显存,二是8GB。可能包含64MB的内置Infinity Cache。
  • Qorvo® Biotechnologies公司赢得 移动应用、基础设施与航空航天、国防应用中RF创新解决方案的领先供应商 Qorvo®, Inc.(纳斯达克代码:QRVO)凭借“快速诊断提速” (RADxSM) 计划中标,赢得美国国立卫生研究院 (NIH) 的 2440 万美元合同。Qorvo Biotechnologies(Qorvo 的全资子公司)公司赢得此合同有助于推动 Qorvo Omnia™ 诊断测试平台的生产,加快市场投放进程。
  • 美光发布第六次年度可持续发展报告 内存和存储解决方案领先供应商Micron Technology Inc.近日发布《快步前行:美光 2021 年可持续发展报告》(Fast Forward: Micron’s 2021 Sustainability Report),凸显美光在特殊时期不但体现出企业韧性,更在促进创新、人、社区和制造等方面取得长足进展。
  • 估值达102亿!比亚迪半导体拟分拆上市 ▲ 了解更多精彩内容 点击上方蓝字关注我们5月11日,比亚迪股份有限公司发布公告称,比亚迪股份拟将控股子公司比亚迪半导体股份有限公司(以下简称“比亚迪半导体”)分拆至深交所创业板上
  • 国内最大车规IGBT厂商分拆上市 5月11日晚间,比亚迪发布公告称,将对公司控股子公司比亚迪半导体计划分拆至创业板上市。根据公告显示,比亚迪股份拟将控股子公司比亚迪半导体分拆至深交所创业板上市。本次分拆完成后,比亚迪股份股权结构不会因
  • 突发!小米被美国移出“黑名单”!  中国半导体论坛 振兴国产半导体产业!    5月12日消息,据彭博报道,根据当地时间周二提交给美国法院的一份文件,小米公司和美国政府达成协议,将搁置特朗普政府将该公司列
  • 小米,赢了! 今年1月,美国政府突然宣布将9家中国公司列入“中国军队公司清单”,并将限制美国投资者交易这些公司的证券,其中就包括雷军旗下的小米公司。此举也造成了小米公司股价大跌,累计损失一度超过30%,而小米也在第
  • 美国将小米移出“黑名单”?中方回应 ▲ 了解更多精彩内容 点击上方蓝字关注我们5月12日,外交部发言人华春莹主持例行记者会。有记者就美国政府将小米公司移出“黑名单”一事提问。华春莹表示,你提到的有关情况我不了解,建议
  • 一个工程师对EMI的见解 在我接触EMI前,很多电源适配器工程师以他们有丰富的EMI调试经验来鄙视我们这些菜鸟,搞的我一直以为EMI是门玄学,也有很多人动不动就拿EMI出来吓人。我想说电源适配器EMI确实很难理解,很难有精确的
  • 新松:撤销服务机器人部门 着力推进工业机器人 公司调整整体业务战略,撤销服务机器人部门,着力于工业机器人产业布局。文|网络新松机器人5月11日下午举办2020年度业绩说明会。公司副董事长兼总裁曲道奎回答投资者提问时表示,公司调整整体业务战略,基于
  • 传特斯拉暂停扩建上海工厂!  中国半导体论坛 振兴国产半导体产业!    5月12日,据外媒报道,知情人士透露,由于中美紧张局势带来的不确定性,特斯拉已经暂停扩建上海工厂计划!3月份曾有传言称,特斯
  • 常用电子产品接口大全(很全,值得收藏) 视频接口:在我们的生活中,电视机、电脑、投影设备、各种播放器上,视频会议产品和监控产品的编解码器的视频输入输出接口上看到很多视频接口,尤其在显卡上面,通常会出现3种甚至更多的接口。这些视频接口哪些是模
  • 2525MHz!终极A卡诞生 NV望尘莫及 华硕今天发布了顶级新卡“ROG Strix LC Radeon RX 6900 XT TOP T16G”,和原来的“ROG Strix LC Radeon RX 6900 XT TOP O16G”相比
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了