Falcon Shores是在Rialto Ridge 取消后的替代品,也是 Ponte Vecchio 的指定后续产品。根据早前报导,Falcon Shores 将会是一款混合型态的XPU产品,因为在这个封装内将会整合 GPU、CPU 与 Memory 在内。然而在周一的会上,英特尔确定 Falcon Shores 将不再是 XPU,而回归到单纯的 GPU 而已。

据路透社消息,当地时间周一(5月23日),英特尔(Intel)就其计划于2025年推出的一款人工智能(AI)运算芯片提供了更多细节。

英特尔在德国举行的一个超级计算会议上表示,即将推出的“Falcon Shores” (猎鹰海岸)芯片将拥有288GB的HBM3内存和 9.8TB/s 的总内存吞吐量,正如预期的那样,它将支持较小的数据类型,如 FP8 和 BF16。这些细节也是英特尔实施战略转型,抢占人工智能处理器市场,以追赶英伟达和AMD的首批披露内容。

Falcon Shores是在Rialto Ridge 取消后的替代品,也是 Ponte Vecchio 的指定后续产品。根据早前报导,Falcon Shores 将会是一款混合型态的XPU产品,因为在这个封装内将会整合 GPU、CPU 与 Memory 在内。然而在周一的会上,英特尔确定 Falcon Shores 将不再是 XPU,而回归到单纯的 GPU 而已。

Falcon Shores GPU 将会是英特尔Xeon Max GPU 系列产品中的一环,采用标准以太网交换,很像英特尔专注于 AI 的 Gaudi 架构。此外,Falcon Shores GPU 将会如同 Ponte Vecchio 般采用Chiplet模块式设计,允许针对单一 GPU 进行程序处理。这个基础性架构非常灵活,可以随着时间的推移集成Intel和客户的新IP(包括CPU内核和其它芯粒),使用Intel IDM 2.0模式制造。

该设备的基本草图还包括一个通用的基于 GPU 的编程接口 OneAPI,它将允许与其他 CPU 和架构广泛兼容。 英特尔还将 CXL (Compute Express Link)支持列为一个关键的差异化因素,这让GPU、AI 芯片和其他加速器可以轻松访问大型存储和内存池。

为何从XPU变成了GPU?

下面我们来分析一下英特尔从 Falcon Shores 中抽出 CPU 内核背后的深层次原因。

英特尔表示,当前计算环境还不成熟,要实现将 CPU 和 GPU 内核混合到同一个 Falcon Shores 封装中的最初目标还为时过早。 如上图所示,随着生成 AI 和 LLM 进入 HPC 空间,不同处理器的工作负载在改变,CPU 和 GPU 内核的最佳组合随着时间的推移而发生变化。 因此也引发了英特尔关于如何构建下一代超级计算架构思维的转变,他们认为现在还不是将客户锁定在特定 CPU 和 GPU 比例的时候。

此外,从设计上讲,处于前沿的超级计算机是针对特定任务的高度专业化设计,针对架构的软件调整只是运行超级计算机的常规操作。 这些因素意味着 CPU/GPU 比率并不是英特尔从设计中移除 CPU 内核的唯一原因。

英特尔还指出,Falcon Shores允许其客户使用各种不同的 CPU,逻辑上包括 AMD 的 x86 和 Nvidia 的 Arm 芯片,以及他们的 GPU 设计,因此不会限制客户只选择英特尔的 x86 内核,CPU 和 GPU 的解耦将为具有不同工作负载的客户提供更多选择。

英特尔表示,使用CXL接口的目的是让其客户能够利用可组合的架构,在他们的定制设计中将各种 CPU/GPU 比率结合在一起。 然而,CXL 接口仅在芯片组合之间提供 64 GB/s 的吞吐量,而像 Nvidia 的 Grace Hopper 这样的定制 CPU+GPU 设计可以在 CPU 和 GPU 之间提供高达 1 TB/s 的内存吞吐量。 对于许多类型的工作负载——尤其是需要内存带宽的 AI 工作负载,这比 CXL 实现具有性能和效率优势。

Ponte Vechhio 还要再多坚持两年

一直到 2025 年的 Falcon Shores 出来前,Ponte Vechhio 仍是英特尔AI及 HPC 市场的最佳 GPU 方案。它将不得不与更先进的 HPC 架构竞争,例如 Nvidia 的 Grace Superchips 和 AMD 即将推出的CDNA3/Zen4 混合体(exascale APU) Instinct MI300,它们都会在 2023年推出。

英特尔数据中心 GPU Max 1550 (Ponte Vecchio) 与 NVIDIA H100 PCIe (Hopper)对比

此次更动 Falcon Shores 的原因主要是英特尔目前规划拥有 2 条产品线,而 Falcon Shores 的推出将大幅度提升产品的灵活性。至于 HPC 用的 XPU 部分仍在持续进行,但它不会是 Falcon Shores 最初发布的一部分。

原本用于虚拟、云加速市场的是Arcitic Sond M,按照之前的规划,它们应该在今年被Rialto Bridge和Lancaster Sound系列新品取代。但最新的路线图中,这两款产品的开发被终止了,转而直接开发下一代的产品,也就是Falcon Shores。

另一方面,AI 部分用的 Habana Gaudi 在进入第 3 代以后,将不会有任何更新,而后续也会被 Falcon Shores 替代。英特尔称,他们“计划整合 Habana 和 AXG 产品 (GPU)路线图”,但透露的整合细节很少。

Gaudi 计算架构与标准 GPU 有很大不同,因此其计算架构似乎无法完全集成到 GPU 中。 因此,英特尔可以将Gaudi设计的较小部分(例如其网络接口或其他 IP 块)整合到其 GPU 中。 

据悉,AMD的Instinct MI300和英伟达的 Grace Hopper均采用混合式CPU+GPU设计,这种做法的优势是可以降低成本并节省电力,但会将客户产品设计与供应商方案配置高度绑定。

与他们相比,英特尔的纯GPU+灵活搭配CPU方案对于某些工作负载来说很好,但它可能无法在某些应用程序的功率、成本或性能方面与对手竞争。

责编:Luffy
阅读全文,请先
您可能感兴趣
如今,7年的研究任务嘎然而止。在当前半导体产业环境下,不乏有恐被制裁的论调,也在更深层次说明了中国在先进半导体制造环节的桎梏,正影响中国产业界向高端移动芯片进发。同样,我们也应该看到,芯片产业是一个投资巨大而回报周期漫长的行业,需要大量的高端设备、核心技术以及长时间的积累与迭代。
人工智能在沉淀发展了几年之后,ChatGPT“横空出世”,一经推出,就受到了全世界的高度关注和热捧。然而,在高度智能的背后,是巨大的成本和算力投入,这与企业的ROI和全球节能减排的目标是矛盾的。这时,NVIDIA把早已研发的秘密武器——DPU和DOCA推出,它们能够大大缩减人工智能计算的成本,提升计算效能,解决当下痛点。或许,DPU将是NVIDIA对高速计算的第三次变革,这一次,属于“预见性变革”。
芯片设计仅是半导体产业链的一个环节。整体来看,印度芯片产业依然呈现极度不平衡状态,即:芯片设计实力突出,但芯片制造非常落后,基本上没有什么芯片代工厂,同样上游材料和设备也依赖于国外。因此,即使印度设计出5纳米芯片,也必然依赖国外代工厂生产。
我们不必对哲库的解散冷嘲热讽,毕竟哲库之后,还有很多手机芯片厂商、立志造芯的车企、初创芯片企业等面临同样的困境,巨大的资金消耗、软件与工具链缺失、产业链生态体系的构建、产品应用的落地……都是绕不开的环节。然而,但哲库的结局有些让人感到遗憾,毕竟三年多的技术研发在很大程度上也是付诸东流。
上个月的2023北美技术研讨会上,台积电又又又透露了一些N2家族工艺节点的新消息——计划中的2nm工艺节点会在2025-2026年到来。结合这次的消息,以及过去1、2年三星和Intel透露相关各自2nm节点的消息,本文尝试展望一下2025年以后的2nm工艺。
后摩智能在存算一体上进行了很好的探索,跟以往基于Flash的存算路线相比,基于SRAM的存算路径可以实时在存算模块中刷新数据,为大算力提供了重要的保障,同时实现与数字无损的高运算精度,成本更低,是真正可以大规模量产的路径。后摩鸿途H30将在今年量产,获得了包括新石器无人车、环宇智行等主机厂、Tier1和算法提供商共计超55家客户支持。
目前在六代线工厂生产 12.9 英寸 OLED 的制造成本估计比 Mini LED 背光的制造成本要低很多。但是,如果在八代线工厂生产OLED,则成本不会下降。另一方面,16.2 英寸 OLED 的制造成本可以在八代线工厂中大幅降低。16.2’’面板在六代线基板中的玻璃效率不如12.9’’面板。OLED iPad 可以被首先导入,用目前的六代线工厂生产。同时,OLED MacBooks 可能只有在八代线工厂准备好之后才会上市。
• 基于 ARM 架构的SoC将会在 Intel 和 AMD所占据的PC市场逐步取得更高的市场份额,预计从现在的 14% 增长到 2027 年的 25%。 • ARM 架构的SoC集成高性能的 CPU核心和存储有望与 x86架构竞争;其所拥有先进的AI 和 GPU 核心,更有机会超越传统的 x86架构。 • 采用 ARM 架构的SoC整合了许多功能,使笔记本型电脑和平板电脑形式更加小巧,同时提供了各种的型式,例如微型电脑和 VR 头戴式显示器。
几乎所有人都在谈论人工智能(AI)技术,对EDA提升半导体和系统公司设计效率的巨大潜力。但就像“玻璃渣里混杂的冰糖”,关于如何在EDA领域充分释放AI能量的现实路径,其实仍然在探索之中。
这起跨国投资案,背后折射出的是整个国产EDA的成熟和发展。在当前的环境下,我们非常乐见,也更应该鼓励这种“走出去的”技术交流。开放、自信,双方基于最基本的技术逻辑和商业逻辑,选择合作共赢。芯华章与Optima,未来在汽车电子功能安全领域的深度合作,令人期待。
行家说Display 导读:今年,TCL、海信、小米等国产品牌在Mini LED背光市场打法越来越卷了。3月21日,TCL带来号称“2023年最值得购买的Mini LED电视”Q10G Pro,实现质
说到一代神机,小米6无疑是万千米粉心中的朱砂痣,江湖人称“钉子户”。如今小米13已经面世半年,诸多亮点被网友热议,例如…… 13的续航功能、13的莱卡光学镜头、13的机身质感、13的屏幕用
亚化咨询重磅推出《中国半导体材料、晶圆厂、封测项目及设备中标、进口数据全家桶》。本数据库月度更新,以EXCEL表格的形式每月发送到客户指定邮箱。中国大陆半导体大硅片项目表(月度更新)中国大陆再生晶圆项
当前有很多串行通信协议,但其中I2C和SPI非常有名。这两种都是总线协议,允许用户进行短距离的串行数据传输。其中,I2C是飞利浦(现在是NXP)制造的两线通信,而SPI是摩托罗拉制造的。这两种协议通常
关注公众号,点击公众号主页右上角“ ··· ”,设置星标,实时关注智能汽车电子与软件最新资讯来源:九章智驾 张萌宇在汽车产业向智能化转型的过程中,汽车的开发模式、消费者对车的认知,以及汽车销售的商业模
据日经亚洲报道,由于芯片设备商的客户在半导体市场恶化的情况下收紧产能投资,九大芯片制造设备制造商中有七家可能在本季度出现销售额下滑。尽管前景预测悲观,但芯片设备商们的股价一直在上涨,反映出投资者对生成
关注公众号,点击公众号主页右上角“ ··· ”,设置星标,实时关注智能汽车电子与软件最新资讯来源:知乎 海瑞思自动化一、车载摄像头防水检测的要点  1、确保车载摄像头的安装位置:应确保车载摄像头安装的
🎁多重活动好礼公开,戳我立即查看!2023安富利汽车生态圈峰会将聚焦「智能驾驶」、「智能网联」与「新能源动力」三大重点,行业大咖共同交流,众多知名技术厂商现场开设展位、展示先进技术,到场嘉宾将共同探索
关注公众号,点击公众号主页右上角“ ··· ”,设置星标,实时关注智能汽车电子与软件最新资讯来源:证券时报5月22日,东风日产超混电驱奇骏正式上市,新车共推出两款车型,官方指导价为18.99万和19.
4月27日,第二届电子纸产业生态发展高峰论坛暨《2023电子纸产业蓝皮书》发布会在上海宝山正式拉开帷幕。本次活动由上海市科委、宝山区政府指导,宝山区发展改革委、宝山区科委主办,CINNO・ePaper