ChatGPT风潮凸显了一个问题:大规模人工智能即便在技术和经济上并非不可能,但现实中也变得不切实际;即使是对环境来说,也是很可怕的影响…

ChatGPT激发了全球对人工智能(AI)的丰富想像力。这个聊天机器人可以写文章、作曲、甚至还可以用不同的语言与人类交谈。如果人们读过任何ChatGPT的诗歌,就会发现,虽然它还没有通过图灵测试,但无论是与数月前、还是与专家对人工智能的预期相比,都是一个巨大的飞跃。在刚刚发布的前5天里,ChatGPT的注册用户就超过了一百万人,这一数字打破了技术应用的历史记录。

这股风潮也强化了以下论点:即人工智能将对人类的生活方式产生巨大影响。有些人预测,到2030年,人工智能透过对制造业、零售业、医疗保健、金融系统、安全和其他日常流程进行精细的最佳化调整,将对全球GDP做出重大贡献。

但这一突然的成功背后,也凸显了人工智能当前最紧迫的问题:即如今的运算基础设施并非为处理人工智能工作负载而建造。在过去5年里,人工智能网络的规模每年成长近10倍。到2027年,数据中心中有五分之一的乙太网交换器将专门用于人工智能、机器学习(ML)和加速运算。

于是,大规模人工智能即便在技术和经济上并非不可能,但现实中也变得不切实际。即使是对环境来说,也是很可怕的影响。因为训练一个像GPT-3这样的模型,就用了1,750亿个节点,耗能高达1,287兆瓦时(MWh),这么大的能耗足以供给大约120个美国家庭整整一年的使用量。如果将该模型性能提高10倍的话(未来肯定会达到),其运算力和能源需求还将增加1万倍。

为了摆脱这种螺旋式上升的资源需求,就需要从头开始重新思考运算架构。对于所有即将到来的变化,虽然不可能全部预测到,但笔者认为以下这些变化即将到来:

运算平台会被完全分解

系统中的每个单元——CPU、GPU、DPU、存储器、储存装置、网络等等,都必须能够依照自己的步调进行升级和改进。以使创新能够跟上演算法需求和容量/传输量需求,这也意味着将消除它们之间的相互依赖。

存储器就是一个明显的例子。在过去的几年里,存储器已经成为扩展性能的瓶颈。虽然对更多宽带和容量的需求一直在不断增加,但现在几乎不可能再扩展主机的存储器介面。

正在走向商业化的CXL技术,可以绕过传统的PCIe介面,而透过CXL连接将更多的存储器连接到处理器。CXL还允许不同的处理器和设备共用外加的存储器池。数据中心还能够从老旧的服务器上回收存储器,用于创建CXL池,以最佳化其总体拥有成本。

这样做最起码能够实现:更好的资源利用率、更高的峰值性能,以及更好的投资报酬率。储存和网络已经在一定程度上被分解,但未来人们将会看到数据中心的完全模组化,不同的功能和/或元件将会分布在各个设备中,并具有动态变化的关系。

光将成为传输媒介

不过,上述分解产生了延迟、潜在的宽带瓶颈也遏制了性能。为了充分发挥分解的潜力,需要一种能够最大限度地减少这些缺点的传输媒介。

如上所述,功耗是一个真正的问题,功率密度也是如此。为了解决新出现的任务和应用,需要建立更大、更密集的人工智能平台。在许多情况下,以所需速率和供电要求实现电气连接时,需要元件彼此靠得很近,这将导致功率密度问题,进而限制了人们在集群中添加更多人工智能元件和进一步扩展的能力。

光是唯一能够有效解决这些问题的传输媒介。光已将机架连接在一起,在下一阶段,光将被用来连接机架内的设备,甚至用于系统节点内部。诸如人们熟悉的CXL等协议,也都将转移到光领域。

有一个例子可以说明人工智能平台的规模。例如一个目前速度为25Tb/s的乙太网交换机。为了简单起见,先不考虑冗余、根和拓扑架构,这个交换机可以容纳大约500台服务器,相互间用典型的50Gbit/s的速率连接。然而,该交换机可以容纳多少个采用以3.6Tb/s (实际发布的总速率为900GB/s)速率连接集群中对等GPU的高端GPU呢?答案是仅为七个!

因此,对更高宽带的需求显然是存在的。虽然铜缆交换机仍将是一个繁荣的市场,并将继续发展,但光交换机将开始吸引高端交换任务。

专注于数据中心内部,以及数据中心之间光通信的PAM4和Coherent DSP已经开始兴起,使光产业走上了一条更可预测的进步之路:光不再像其早期那样,仅仅是小作坊式的业务。即将推出的1.6T (200G/lambda)光模组在增加宽带的同时,还能减少元件数量、降低成本和功耗,具体取决于配置和工作负载。

目前光技术何时,以及如何被整合进晶片中,仍然是一个争论不休的话题。由于一系列原因,包括稳步提高的性能、广泛的生态系统、客户选择等,可插拔的光学模组,在未来几年仍将是通用工作负载的标准。然而,共同封装(co-packaged)光学解决方案,在人工智能集群内可能会很快得到部署。虽然共同封装光学元件的可靠性和性能仍需得到进一步证明,但透过共同封装光学元件,可能实现宽带、效率,以及功率密度的提升,将推动研究的快速发展,并反过来导致其性能的突破。

人工智能训练将实现语言本地化

训练一个什么都知道、并不断变得更智能的单一模型,在规模上是值得怀疑的。一个较好的方法是在云端训练一个具有通用能力的“通用”模型,然后再根据覆盖地区的具体情况、用途、目标受众等,重新进行边缘训练。接着可以考虑将所有的最佳化模型相互连接起来,创建一个知道一切的超级模型,就像由许多网站组成网际网络一样。潜在地,对用户来说,这些都必须是透明的。

举一个人类自身的例子:孩子从第一天起就学会了说话,并具备与其他人互动的能力,这是进化训练人类作业系统的一部分。然后,根据当时当地的周围环境,这个孩子利用相关的语言、知识、行为等,对这一继承训练的能力进行“精细最佳化”,从而实现自我进步和成长。这种人类学习脚本,同样也适用于人工机器学习。

随着时间的推移,能耗和运算周期将下降,而消费者满意度也将上升,系统将输出更好和相关度更高的回应。

最后我们一定会成功

尽管其中的许多挑战令人生畏,但毕竟它们都还没有超出人们的想像范围。上述所描述的这一切都不需要特别的资源,随着人工智能创新不断渗透进所有其他形式的运算中,技术努力所得到的回报将会越来越丰富。

接下来,需要的只是一系列的试错过程,以及用新的范式替换一些旧的范式。透过不断扩展升级,就能成功应对人工智能的挑战。

(参考原文:Are we ready for large-scale AI workloads?,by Noam Mizrahi)

本文同步刊登于台湾版《电子工程专辑》杂志20238

责编:Amy.wu
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
尽管黄仁勋重申将重视中国市场,且继续推出特供版AI芯片,但性能无疑会再次“阉割”。据悉,H20等全新特供芯片的研发、设计、生产,将通过后道点断生产工艺,来满足美国新的AI禁令要求。
《报告》显示,2023年上半年,中国人工智能服务器市场规模环比增长54.1%。IDC预计,全球人工智能硬件市场(服务器)规模将从2022年的195亿美元增长到2026年的347亿美元,五年年复合增长率达17.3%;在中国,预计2023年中国人工智能服务器市场规模将达到91亿美元,同比增长82.5%,2027年将达到134 亿美元,五年年复合增长率达21.8%。
尽管SK海力士利用TSV技术,使其HBM产品一直保持业界领先水平,但仍需解决产能偏低、成本过高的问题。为此,SK海力士持续研发主打封装技术TSV外,还在关注“扇出型晶圆级封装”,将其视为促使未来利润产生的新的增长动力和技术。
对Graphcore而言,时间是非常重要的。2022年5月,Graphcore宣称新一代芯片将在2024年的某个时候上市。届时,Graphcore需要向市场和资本证明自己的发展潜力。这很重要,也很紧迫。
联发科技(MediaTek)近日在加利福尼亚州拉古纳尼盖尔(Laguna Niguel)举行了年度高管峰会。峰会上强调了其以人工智能(AI)为驱动的高端定制 SoC(ASIC)战略;从 Wi-Fi 7 芯片到 5G 和 5G RedCap 瘦调制解调器的全新连接解决方案,凸显了其物联网战略和发展势头。
近2年全球存储产业行情变化,深圳市时创意电子有限公司董事长倪黄忠用“过山车”这个词来形容。2021年存储严重缺货,包括晶圆短缺,颗粒短缺,产能短缺,库存短缺,供不应求的终端需求使得存储价格大幅上涨,不少存储厂商赚的盆满钵满。随之而来的是2022年的产能过剩,与2021年全然相反的局面,包括晶圆、颗粒、产能、库存都处于供过于求的状态,价格一路下滑至2023年的Q1-Q2,包括美光、SK海力士、三星等存储厂商营收巨额亏损。在存储厂商们一系列的减产延长、去库存等措施下,2023 年Q3-Q4迎来了存储价格上涨的趋势,晶圆、颗粒供给趋紧。
据最新HBM市场研究显示,为了更妥善且健全的供应链管理,NVIDIA也规划加入更多的HBM供应商,其中三星(Samsung)的HBM3(24GB)预期于今年12月在NVIDIA完成验证。而HBM3e进度依据时间轴排列如下表所示,美光(Micron)已于今年7月底提供8hi(24GB)NVIDIA样品、SK海力士(SK hynix)已于今年8月中提供8hi(24GB)样品、三星则于今年10月初提供8hi(24GB)样品。
受智能手机产量下滑,以及品牌厂搭载趋势改变的影响,预估2023年智能手机相机模组出货量年减幅度将再扩大至8.9%,约40.65亿颗。而经过一年的库存去化,在2024年智能手机生产量有望恢复的预期下,明年智能手机相机模组市场有望恢复成长,出货量年增率预估3%,约41.71亿颗。
近日,武汉芯源半导体正式发布首款基于Cortex®-M0+内核的CW32A030C8T7车规级MCU,这是武汉芯源半导体首款通过AEC-Q100 (Grade 2)车规标准的主流通用型车规MCU产品。
1200 V分立器件提供出色的性能,有助于加速全球能源转型
第六届半导体大硅片论坛将于12月7-8日在上海召开,来自新昇、超硅、上海集成电路协会、KLA等公司的专家将带来精彩报告工业参观:半导体大硅片企业上海新昇半导体与上海超硅半导体,目前新昇名额已满11月3
『这个知识不太冷』系列,旨在帮助小伙伴们唤醒知识的记忆,将挑选一部分Qorvo划重点的知识点,结合产业现状解读,以此温故知新、查漏补缺。在过去十年中,移动无线数据快速增长,使得运营商愈加迫切地需要新频
什么情况下网络安全问题会变成物理安全问题?换句话说,什么情况下半导体必须具有内置篡改检测器?对于为美国武装部队或任何其他武装部队打造下一代武器系统的公司来说,答案显而易见。他们必须假设这些设备会被遗留
一年一度的白鲸出海全球流量大会GTC重磅来袭!今年GTC出海展区全面升级,规模扩增至15000平方米,覆盖游戏、应用、技术及品牌出海等热门行业,预计将迎来累计超30000名跨境出海相关从业者莅临参观。
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,根据财联社的报道,全美3000多家汽车经销商组成的联盟11月28日向拜登发出一封公开信,呼吁他在电动汽车推广政策上踩刹车。该联盟在信中写道,这
2023年11月标准动态英文标准发布IPC-1791D 可信赖的电子产品设计,制造和组装供应商要求适用行业:1. Board Fabricator/Manufacturer2. EMS/Assembl
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,据魅族科技微博消息,魅族品牌将正式进入汽车市场,第一款魅族汽车MEIZU DreamCar MX,将在2024年一季度启动DreamCar共创
  大型电子工业洁净厂房的防火设计至关重要,以确保生产设备、人员和财产的安全。以下是合洁科技电子洁净工程公司总结的一些常见的防火设计分析要点。   
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,科创板上市公司孚能科技(688567)11月29日晚公告,广州工控集团拟将获得公司控制权的方式,由此前的协议转让股份方式,转换为广州工控集团认
芯片超人现有1600平米芯片智能仓储基地,现货库存型号1000+,品牌高达100种,5000万颗现货库存芯片,总重量10吨,库存价值高达1亿+。同时,芯片超人在深圳设有独立实验室,每颗物料均安排QC质