无论你走到哪里,都能看到与人工智能有关的报道。无论应用多么微不足道,这些故事都不可避免地暗示着与人工智能的某种联系(或因人工智能而带来的好处)。虽然其中有些联系是合法的、实质性的,但许多都是营销人员所谓的“借势”或“借光”,目的是蹭人工智能的热度。
人工智能还催生了另一件事:一大批专家正在评估人工智能的电力和冷却需求。这些评估来自智库、政府机构、学术界、人工智能供应商、电力和冷却系统供应商以及顾问——几乎涵盖了所有想要表达观点并希望以某种方式与人工智能相关联的人。如图1所示,他们随随便便就能预测出未来几年的电力和冷却需求,预测的时间可以提前几年,有时甚至十几年。
图1:该评估显示,2025年至2030年间,美国数据中心的电力需求预计将增加约400TWh,复合年增长率(CAGR)约为23%。(来源:麦肯锡公司)
谈论和书写有关人工智能的电力和冷却需求本身已经成为一种独立的产业。有趣的是,一些“专家”表示,人工智能的能源需求将急剧增加,而另一些人则认为,人工智能将实现对大型能源资源的更智能利用,从而带来总能耗的净减少。我的看法是:随便转转轮子,你喜欢哪种情况就选哪种。
尽管许多预测表面上看起来非常精确和自信——通常精确到两位数,有时甚至精确到三位数——但实际上,所有这些预测充其量只是非常粗略的估计和猜测。这些预测还常常受到政治议程或自我服务目标的影响。
我们都知道,基线数、假设和增长/缩减率的微小变化都会导致结果的大幅波动,这是由多年来的复合效应造成的。一些预测模型提供了多种方案,这至少默认了这些都是估算,包括猜测;而另一些预测模型则没有这样做。如果我们回过头来检查,发现它们与未来的实际情况相差不超过20%到30%,那我就会感到非常惊讶了。
那么,该怎么办呢?
毋庸置疑,人工智能计算确实需要消耗大量电能,并且需要大量冷却。现在和将来需要多少才是真正的问题。要想让“多”变“少”,可以考虑采取多种策略:
- 提高设备效率:这似乎是一个显而易见的赢家。例如,最大的人工智能处理器制造商英伟达(NVIDIA)表示,其最新处理器(名为Blackwell)的能效将比之前的高端版本高出约25倍。当然,从历史上看,我们已经看到了这样一个悖论,即需要通过扩展来消耗可用容量,因此能耗较低的芯片最终可能仍会被安装在净功耗排名高得多的系统中。
- 寻找不同的冷却水源:这也是一个棘手的问题。人工智能的用水量既有大规模数据,也有传闻。谷歌表示,其数据中心在2023年的全球用水量约为61亿加仑,而根据加州大学河滨分校和德克萨斯大学阿灵顿分校研究人员的研究,OpenAI的GPT-3模型每回复10到50次用户查询,消耗的水量相当于一瓶16.9盎司的水。然而,“消耗”一词在这里是个棘手的词。尽管这个词被广泛使用,但这些数据中心真正消耗的水量并没有它们使用或需要的那么多。获取足够的水可能是个问题,但一旦有了水,就不会流失,而且可以重复使用。因此,在某些方面使用这个术语会产生误导,但在其他方面则不会。
- 使用更好的冷却技术:散热所需的电能本身就很重要;我看到的数字显示,它占数据中心总耗电量的25%到40%。有一些冷却技术可以降低能耗,但会增加新的复杂性。例如,基本的液冷技术是将冷却液或冷水循环到处理器芯片顶部的“冷板”上。这种直接对芯片的液体冷却比强制风冷更有效,因为液体比空气具有更高的导热性和热容量。甚至还有一种更激进的浸入式冷却方法,即把处理器板放置在冷却液大槽中。由于冷却剂的问题和实际应用中的明显挑战,这种技术仍处于早期阶段。这些方法都无法从根本上解决需要去除大量热量的问题。相反,它们的目标是将不需要的热量转移到一个被称为“远离”的神秘地方,在那里成为别人的问题。收集提取的热量可以实现部分回收和冷却投资回报,但这会带来新的问题和成本。
- 为人工智能进行更智能的训练:原则上,更好的训练策略可以减少电力和冷却需求。这可能包括在训练过程中仔细控制人工智能模型接收信息的种类和数量等方法。它还可以让人工智能训练删除冗余和低质量数据,从而产生一个更小的数据集,当用户向它提问时,它可以更轻松地筛选数据。
- 放慢速度:功耗与速度的关系并不是线性的,响应时间的轻微减慢会导致功耗的大幅下降。在麻省理工学院和美国东北大学的一项研究中(有很多研究!),研究人员发现,将Meta的一个人工智能装置的功耗降低22%到24%,人工智能响应查询的速度仅降低5%到8%。在某些情况下,这可能是一个可以接受的成本/效益权衡。
人工智能能耗和冷却的未来将会是怎样的?我当然无法预知,其他人也无法给出确定的答案。但有一点是毋庸置疑的:人工智能已经催生了一个子行业,专门致力于这些问题的建模,并撰写关于预测结果的技术和营销论文,有时还提供建议。这个行业几乎总是寻求更多的拨款或客户来支持进一步的研究。这比实际进行实现目标所需的软硬件艰难工程设计要容易得多。
(原文刊登于EE Times美国版,参考链接:AI Power and Cooling Spawn Forecasting Frenzy,由Franklin Zhao编译。)
本文为《电子工程专辑》2025年4月刊杂志文章,版权所有,禁止转载。免费杂志订阅申请点击这里。
