广告

再用几组数字,来看摩尔定律停滞的严峻性

时间:2021-09-30 作者:黄烨锋 阅读:
这两年我们探讨有关摩尔定律的话题也不少,包括算力需求依然强劲,但半导体器件尺寸微缩速度却实实在在放缓了,该怎么办的各类文章。本文再从相对实际的角度来谈谈,摩尔定律放缓的各种外在表现;也算是从更全面的角度来理解摩尔定律的放缓。
广告
EETC https://www.eet-china.com

“摩尔定律”估计是行业内被提及频率最高的词之一了,又是这两年的热门话题。从不同市场参与者的角度,大家对于摩尔定律是否放缓或停滞是各有说辞的。比如尖端工艺foundry厂,普遍会说摩尔定律还能延续很久,不信看我们的roadmap;比如AI芯片厂商倾向于说,摩尔定律放缓是事实,我们需要架构革新;学界则说,材料革命必将来临......

这两年我们探讨有关摩尔定律的话题也不少,包括算力需求依然强劲,但半导体器件尺寸微缩速度却实实在在放缓了,该怎么办的各类文章。本文再从相对实际的角度来谈谈,摩尔定律放缓的各种外在表现;也算是从更全面的角度来理解摩尔定律的放缓。

系统地谈摩尔定律停滞的paper非常多,包括前年我们写的《深度学习的兴起,是通用计算的挽歌?》较多参考了MIT的那篇paper(The Decline of Computers as a General Purpose Technology: Why Deep Learning and the End of Moore’s Law are Fragmenting Computing)。

美国CSET(Center for Security and Emerging Technology)去年4月写过一篇paper,题为AI Chips: What They Are and Why They Matter*,阐述摩尔定律放缓的思路和MIT那篇大同小异。不过在细节上作了更大程度的完善。本文我们参考其中提供的一些数据,有兴趣的读者可参考文末的reference做进一步的深入理解。

AI芯片成本,来看摩尔定律的放缓

这些paper有个非常大的共同点,即本身是探讨AI芯片,前面却会花很大篇幅去谈摩尔定律放缓的事实。在大规模数据并行计算方面,AI芯片效率和算力上,甚至能够达到CPU这种通用芯片的1000倍。要是换算成摩尔定律,则CPU需要26年时间才能达成这种程度的提升。

虽然总感觉这种说法相当的流氓,通用芯片和专用芯片无论如何都不该这么比,但这表达的是行业的整体转向。因为AI芯片实实在在的部分抢占了原属于CPU的市场份额,无论AI芯片形态是GPU、FPGA还是ASIC。CPU在未来甚至有被各类专用芯片边缘化的可能性——这一点在《深度学习的兴起,是通用计算的挽歌?》一文中已经有比较详细的阐述。

本文不会着重去谈AI芯片,但即便是AI芯片,其效率也和制造工艺关系甚大。传统认知中,ASIC类别的芯片由于市场更窄,所以考虑到成本摊薄的问题,ASIC芯片总是更倾向于采用更旧的工艺,而不是尖端工艺。但AI芯片如今市场非常大,有相当规模的ASIC AI加速芯片也都开始用7nm这样的尖端工艺,或次尖端工艺;而相对通用的数据中心GPU采用尖端工艺则是必然。

抛开AI技术本身的高速发展,包括各种模型、算法和库优化方案造成的性能和效率提升,AI芯片在制造工艺层面也受制于器件尺寸微缩,或其他先进制造封装技术。所以我们首先来谈谈,摩尔定律是如何影响AI芯片的——这也是个很有意思的话题。

AI芯片选择何种工艺还是颇有讲究的。AI芯片的总“成本”需要考虑到后续的运营成本,比如说用旧工艺,则大规模AI计算(如数据中心training)的电力开销和效率会显著更低,甚至这种运营成本会远高于芯片制造成本。这些也需要考虑到AI芯片的成本中去。这就涉及到成本效益计算了。

具体应该计量的“生产成本”包括了制造成本——fab工厂、设备架构消耗、材料、人力、R&D投入、利润;设计成本——fabless企业需要投入的;此外还有ATP(封装测试,assemble, test, package)成本。所以这里定义生产成本包括foundry厂制造成本、芯片设计成本以及ATP成本。另外还需要考虑到芯片的运营成本,主要是能耗成本。

该对比基于相同晶体管数量,以Nvidia P100 GPU服务器级别芯片为参考;对于一些更老的工艺,也需要考虑到reticle limit,所以老工艺实现同等晶体管数量,会换算成多颗chip构成一个系统;注意这个对比可能并未考虑其他层面的AI优化技术和系统互联折损

从CSET这份paper构建的模型来看,在不到2年的时间里,尖端工艺AI芯片(7nm/5nm)的运营成本,就会超过其生产成本。而旧工艺AI芯片(90nm/65nm)的运营成本在此期间可能达到生产成本的3-4倍之多。上面这张图是将一颗芯片的运营时常拉长到3年(也就是芯片用上3年),则在不同工艺之下的AI芯片,所需支出的能耗成本逐年增加。

这张图表达的一个重要信息在于,同时计算生产和运营成本,尖端工艺AI芯片的成本效益会比旧工艺AI芯片,高出至多33倍。

这里随即得出更有趣的一些结论,也就是在运营时间达到多久以后,新旧工艺之间谁才更划算的问题。上面这张图作了这方面的表达。比如说90nm工艺和65nm工艺相比,运营时间以3年为界限,低于3年的情况下90nm造AI芯片更划算;如果芯片要用3年以上,则65nm更划算。

这其中可表现出摩尔定律放缓的一点在于,在7nm vs 5nm这一代,运营时间临界值显著增加。对于一颗5nm工艺的AI芯片而言,运营该芯片8.8年所需的成本,加上生产成本,可达成与7nm芯片相同的生产+运营成本。也就是说,在运营不足8.8年的情况下,以7nm工艺来造芯片更划算;而达到8.8年以上,5nm工艺更划算。

事实上,企业更新服务器芯片的常规周期是3年或以上,和如今工艺新节点迭代周期差不多——理论上,每次有新工艺出现,服务器芯片就可以做一次同步更新。但在5nm这一代,企业对这代工艺的采用,恐怕需要更久时间才能达到成本效益。

这是摩尔定律对AI芯片达成直观影响的重要体现。当然还是需要强调,该模型构建是CSET做的——它可能没有考虑到器件微缩之外的其他技术因素。不过我们认为,大方向的确如此;或者这个结论至少可表达摩尔定律的显著放缓。这个思路还是挺有意思。

摩尔定律放缓的一些实际数字

摩尔定律从上世纪60年代提出,假设到如今是满速运转没停过、没放缓的,那么现在芯片上单位面积内应有的晶体管数量,应该比现在实际的量多出15倍。这个结论来自Communications of the ACM杂志2019年2月的一篇paper (A New Golden Age for Computer Architecture)。

从可追溯的数字来看,1978-1986年CPU每年速度提升22%,主要是基于时钟频率提升(frequency scaling);1986-2003年,CPU速度每年提升52%,主要是得益于频率提升,以及设计优化——尤其是并行计算;2003-2011年,每年速度提升23%,这一阶段频率提升是放缓的,但多核设计依然实现了更高的并行度。而2011-2015,CPU并行计算再次发力,也才促成了12%的每年速度提升。

从能效的角度来看,2000年之前CPU最高达成每1.57年整体效率的翻倍提升;但自从摩尔定律放缓,以及晶体管功耗红利的持续下降,这个速度放慢到了2.6年。这些数字基本也算是共识了。一个更直观的状况在于,Intel的32nm与22nm工艺都是在前代工艺的2年后更新的,与摩尔定律基本保持一致;但22nm与14nm,中间隔了3年;14nm和10nm迭代之间,中间隔了4年。

而且在器件尺寸微缩的同时,功耗表现和性能的提升未能保持同步。2004年前后,65nm节点实现晶体管密度提升之际,功耗降低和速度提升是相对更加迟缓的。上面这两张图展示的是从90nm到5nm发展期间,台积电、三星与Intel各代工艺节点之间的晶体管开关速度(frequency scaling)和功耗变化(相比上一代的变化百分比)。

台积电可能是颇具代表性的,即从拟合的趋势线来看,符合我们对摩尔定律放缓的认知,一路在速度提升、功耗降低方面变慢或趋于平坦;Intel的情况是性能提升亦在放缓,但与此同时确保更好的功耗表现。(这些数字主要是基于台积电、三星和Intel在发布会上公开的信息)

其实将这些数据与处理器这些年的性能提升与功耗降低作比较,就会发现晶体管层面的创新,对于处理器过去15年的效率和性能提升,还是扮演了最重要的角色的。此前AMD在HotChips上也明确过,即过去10年间,造成处理器性能提升的主要因素中,占比最大的就是工艺技术的进步。它比编译器、微架构、电源管理等方面的贡献都要大得多。

不过有个通用处理器性能与效率提升放缓的事实值得一提:抛开一些增加专用固定电路的方案不谈(比如说给CPU加入AI指令支持等),为通用处理器增加更多的晶体管能够带来的性能提升变得越来越有限。这主要是因为能够从并行计算获得的速度提升,这些年受到边际递减效应的影响。

并行度本身是受限于串行计算的时间占比的(比如线程间的计算结果有关联性,则无法实现并行计算)。某个算法中即便仅有1%的部分需要串行计算,那么处理器能耗也将有45%的浪费(因为此时处理器运算单元的闲置率很高)。

而实际上大部分应用所需的串行计算占比还不止这些,则浪费也就更大。处理器架构拓宽、核心数增加、晶体管增加,很大程度都是增加并行度。其中的边际递减效应是存在的。这也是通用处理器在摩尔定律持续之际的尴尬所在。

工艺迭代的技术难度与成本飙升

有关制造工艺技术提升越来越难,无论是材料、制造还是各不同角度,这已是共识。也是因为技术挑战的存在,导致尖端工艺更新越来越难。Intel 10nm以及Intel 7工艺的难产都与此有莫大关联,更不用提GlobalFoundries很早就退出了7nm工艺技术的竞争。

早前《深度学习的兴起,是通用计算的挽歌?》一文已经相对详细地探讨了,工艺迭代在成本方面的飙升。即当前的普遍认知在于,单纯就尖端工艺的建厂成本之高,及每次迭代带来成本的急剧攀升,可能已经超过了半导体行业本身的年复合增长率。

在这样的大背景之下,唯有通过减缓工艺迭代的节奏,以及提升foundry销售服务的价格,并且还要侵吞更多属于竞争对手的市场,才有生机可言。AI Chips: What They Are and Why They Matter这篇paper给出的数字是,如今半导体生产设备年增长率11%,平均每颗芯片设计成本增长24%,比半导体市场7%的增长率还要高。

这个数字比MIT给的还要悲观。无论谁家数字更准确,尖端工艺投入成本的增加是不争的事实。在半导体制造设备中最为昂贵和复杂的组成部分,尖端工艺光刻机工具,1979年每台45万美金;2019年是1.23亿美金。

所以其实这么多年来,参与尖端工艺研发生产的芯片制造商,和光刻机企业数量都是在逐年下降的。(90nm以后,除了ASML之外,尼康成为唯二的参与者;到5nm也就只剩ASML)

上面这张图是不同工艺节点,带来芯片设计成本的提升,分别来自IBS(International Business Strategies)和Gartner,数据量级和趋势都是一致的。设计成本提升,除了复杂度提升和时间成本增加,半导体行业用人成本也在显著增加。据说2015年和1971年相比,人力研究投入增加18倍,每年提升7%。

以每一个晶体管的设计与制造成本为指标,来衡量工艺节点迭代是否保持经济效益,听起来是比较靠谱的。2018年有篇题为Measuring Moore’s Law: Evidence from Price, Cost, and Quality Indexes的内容做过这方面的考量,即历史上曾有一段时间,这个指标每年下降20-30%——也就是工艺迭代带来了更高的经济效益。但部分分析师认为,自28nm以后,该趋势便不复存在。

期望这些数据能够给读者更多的思考。最后我们给出一些摩尔定律停滞和放缓的“解决方案”文章,虽然这不是本文要谈的重点,来自不同层级的市场角色或技术。比如晶体管结构革命;比如如今谈得很多的more than Moore,先进封装技术;还有EDA厂商在提从系统层面来实现性能与能效整体提升的;

以及AI芯片及更多专用架构芯片的问世,大幅提升不同应用场景处理效率的方案;还有对冯诺依曼体系革命的存内计算等等新技术……都可能成为半导体行业续命的存在,附在本文的最后。通过微信阅读本文的同学可在电子工程专辑主站查看以下内容:

异构集成、器件结构、先进封装等综合解决方案;还有存内计算、神经拟态计算

EDA厂商提出系统层面解决方案

Intel的3D封装技术台积电的3D封装技术

快于摩尔定律的AI芯片的专用于通用之争

FPGA在摩尔定律失效时迎来的机会

架构革命:软件定义芯片

Reference:

Saif M. Khan and Alexander Mann, "AI Chips: What They Are and Why They Matter" (Center for Security and Emerging Technology, April 2020), cset.georgetown.edu/research/ai-chips-what-they-are-and-why-they-matter/. https://doi.org/10.51593/20190014

责编:Luffy Liu

  • 讲得有点意思
EETC https://www.eet-china.com
本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
黄烨锋
欧阳洋葱,编辑、上海记者,专注成像、移动与半导体,热爱理论技术研究。
  • 半导体存储器的发展历程与当前挑战 如今,DRAM技术的发展面临很多和CPU相同的挑战,包括多重图形化、邻近效应和存储节点泄漏等。DRAM的开发需要精确的建模才能预测前述问题的影响并做相应的优化来避免良率受损。
  • 格芯:重新定义半导体制造创新 2021年的格芯技术峰会,是格芯在7月推出全新品牌后举办的首场大型活动,也是观察格芯未来5至10年战略发展计划走向的最佳窗口。
  • 如何驱动逻辑微缩进入3纳米及以下技术节点? 逻辑芯片,是电子产品中主要的处理引擎,功耗和性能对其至关重要。然而,伴随着晶体管大小不断逼近原子的物理体积极限,传统摩尔定律下的2D微缩技术不再能同时改善芯片的性能、功率、面积成本和上市时间(即:PPACt)。因此,我们需要综合地采用多种方法,更为确切地说,包括新的系统架构、新的3D结构、新型材料、缩小晶体管尺寸等新方法,以及能以新方式连接芯片的先进封装方案。
  • 封装技术跟得上现有的科技脚步吗? 封装技术简单来说指的是将塑料材料包裹在物体周围的过程,从而在物体周围形成保护体积,犹如胶囊一样,该技术早自40年前在半导体封装和组装工艺流程中发明集成微电子 (也成为,Integrated Circuits,IC“集成电路”)时已被采用。
  • 2021年全球晶圆代工市场有望实现创纪录的 23% 增长 用于 5G 智能手机、网络和数据中心处理器的应用处理器推动前沿增长,但需求遍及所有细分市场。
  • 如何打造全方位有国际竞争力的半导体设备公司? 数码产业的发展是一场深刻的工业革命。美国公司预测, 2020年数码产业的产值在全球企业 总产值占比41%。到2035年数码产业的产值极有可能会超过全球企业总产值的 50%,数码工业和传统工业是世界经济的两大支柱。而以微观加工为基础的数码产业的四个基本层次—半导体设备是数码产业的基石。
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。

  • SynSense时识科技与Prophesee普诺 基于本次战略合作,SynSense 时识科技将自主研发的低功耗视觉 SNN 处理器 DYNAP-CNN® 与普诺飞思基于事件的 Metavision® 传感器结合在一颗单芯片上,并专注于开发一系列低成本且可大批量生产的模组产品。
  • 新品上线 | 源来!我的测试方案只差 新机型发布

    为了满足市场对于低电压大电流线性电源的需求,普源精电(RIGOL)DP800系列线性直流电源精心推出了高性能新机型:DP813A和DP822A。DP813A是单通道双量程电源:8V*20A或20V*10A,DP822A则是双通道电源:5V*16A || 20V*5A。新机型为光通讯模块测试、芯片和集成电路测试、半导体测试和工业ATE测试等多个行业及应用提供了大电流、低纹波、高精度的可编程线性电源。
  • 浅析硬件“好声音”: 声学器件 随着智能化产品的普及,音视频硬件在电子设计中所占的比例越来越高。常见如电视机、导航仪、商超机器人等。音视频硬件中,声学器件是必不可少的基础元件,声学器件主要包括麦克风和喇叭,麦克风拾取声音,喇叭播放声
  • 新能源汽车行业招聘! ↑ 点击上面 “电动知家”可以订阅哦!随着新能源汽车产业的快速发展,电池行业人才短缺问题日益凸显。根据国务院正式发布的《新能源汽车产业发展规划(2021—2035年)》,到2025年,新能源
  • 曝华为“造车”新模式!新车将出或命名“傲图” 点击上面↑“电动知家”可以订阅哦!电动知家消息,消息人士向相关媒体透露,继与赛力斯合作华为智选SF5车型之后,未来华为智选还将迎来第二款与赛力斯合作的新车——傲图。并且该车与此前“华为智选赛力斯SF5
  • 工信部:支持新能源汽车下乡 充电设施建设将纳入城乡整体规划 点击上面↑“电动知家”可以订阅哦!电动知家消息,工业和信息化部官网日前发布了关于政协第十三届全国委员会第四次会议第0456号《关于促进农村地区新能源汽车推广,助力乡村振兴战略的提案》(以下简称《提案》
  • 【企业直聘】湖南高精特电装备有限公司|电子工程师|湖南株洲 找工作加入凡亿企业直聘群几十家中大型企业岗位等你来更多岗位信息扫码推荐招聘详情电子工程师月薪范围:8K~15K工作城市:株洲岗位职责:1、 从事永磁同步电机驱动器的电路板原理图设计,PCBLAYOUT
  • 福布斯2021全球最佳雇主榜:三星电子居榜首,华为、腾讯、京东进入全球TOP100 福布斯与市场研究公司Statista合作,对58个国家在跨国公司和机构工作的15万名全职和兼职员工进行了调查,编制了“2021全球最佳雇主榜”。在上榜的企业中有236家美国企业,91家德国企业,紧随其
  • 【干货分享】为什么硬件测试如此重要???  ▲点击上方公众号名片关注了解更多▲为什么要写一篇关于硬件测试的文章?硬件测试是电子产品开发过程很重要一环,产品在设计阶段很多潜在的问题只看表面是看不出来的,各模块电路必须有针对性的测试才能
  • 杨振宁眼中的物理学之美 电子万花筒平台核心服务 中国最活跃的射频微波天线雷达微信技术群电子猎头:帮助电子工程师实现人生价值! 电子元器件:价格比您现有供应商最少降低10%射频微波天线新产品新技术发布平台:
  • 日本补贴台积电赴日建厂将引贸易纠纷?恐违WTO 规定 2021射频前端芯片设计线上研讨会【10月21日 直播 】台积电宣布有意赴日设厂,日本政府打算接下来的经济刺激方案,编列预算补助最多一半成本。不过可能违反世界贸易组织(WTO)的公平竞争原则。日经亚洲
  • 【企业直聘】上海朗骥电子科技有限公司多地|多岗位|多地 找工作加入凡亿企业直聘群几十家中大型企业岗位等你来更多岗位信息扫码推荐招聘详情招聘工作地址:上海、南京、苏州、杭州、武汉、西安、成都入门级初级PCB工程师待遇:5-7K能力要求:1. 能制作简单的封装
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了