分析丨HBM,并非固若金汤?

原创 AI芯天下 2024-08-09 20:30

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言
随着人工智能、机器学习等技术的快速发展,对高速且大容量内存的需求急剧增加。

HBM与AI芯片的产业链涵盖了从原材料供应、芯片设计、制造、封装测试到最终产品的多个环节,两者之间的博弈关系是典型的合作竞争关系。


作者 | 方文三
图片来源 |  网 络 


HBM现阶段面临的挑战和难点


①HBM的3D堆叠技术成本高昂,主要依赖于昂贵的硅中介层和TSV(硅通孔)。


例如,英伟达的H100加速卡物料成本为3000美元,而SK海力士提供的HBM芯片成本高达2000美元。


高成本是HBM普及的主要障碍,尤其是对于中小型厂商。尽管HBM在性能上具有明显优势,但其高昂的价格使得许多企业望而却步。


②HBM的高带宽特性使其产生的热量较高,需要有效的散热解决方案。


其2.5D封装结构会集聚热量,靠近CPU和GPU的布局又会加剧这种情况。


散热问题不仅影响HBM的性能,还可能导致芯片过热和性能下降。解决这一问题需要复杂的散热设计和材料选择。


③HBM的高带宽特性可能使得数据在传输过程中容易受到攻击和窃取,需要采取加密技术和访问控制等措施来保护数据安全。


数据安全性是HBM应用中不可忽视的因素。尽管有加密技术,但如何确保数据在传输和存储过程中的安全性仍然是一个挑战。


④HBM通过3D堆叠及TSV技术实现高带宽和低功耗,但这也带来了堆叠精度、TSV制作、热管理、电源和信号完整性等技术难点。


这些技术难点需要高精度的制造工艺和复杂的设计,以确保HBM的稳定性和可靠性。



AI芯片在寻求其他存储方案时的权衡


一方面,生产 HBM 需要先进的生产设备和工艺,而这些资源在短期内是有限的。


例如,台积电的 CoWoS 封装技术在满足HBM生产需求方面存在一定的产能瓶颈。


另一方面,随着AI芯片需求的快速增长,HBM的需求也急剧上升。


但HBM的生产周期较长,从设计到量产需要数月的时间,这使得其产能的提升速度难以跟上市场需求的增长速度。


AI芯片制造商在选择存储方案时,需要综合考虑性能、成本、功耗、产能等多方面的因素。


然而,HBM(高带宽内存)并非普通DRAM所能比拟,其价格已攀升至令人咋舌的水平。


在相同存储密度下,HBM的价格约为DDR5的五倍。


据最新数据显示,HBM在AI服务器成本中的占比高居第三,约占整体成本的9%,导致单机平均售价激增至18000美元。


以英伟达H100加速卡为例,其整体物料成本高达3000美元,其中HBM芯片的成本占比即达三分之二,达到2000美元之巨。


对于财力雄厚的行业巨头而言,他们或许能够继续加大投入,采购更大容量的HBM以满足需求。


然而,对于中小型厂商而言,高昂的HBM成本却成为了他们进军大模型领域的重大障碍。


随着AI技术在智能手机、电动汽车及云服务等领域的广泛应用,越来越多的企业开始寻求更为经济高效的解决方案。


部分小型企业因不愿承担高达20000美元的费用,而拒绝购买市场上被视为顶尖选择的英伟达高端GPU。



Tenstorrent成替代HBM的典型案例


在此背景下,Tenstorrent公司正积极筹备其第二代多功能AI芯片的年底上市。


该公司声称,在特定领域,其产品在能效及处理效率方面均优于英伟达AI GPU。


具体而言,Tenstorrent的Galaxy系统效率为英伟达DGX AI服务器的三倍,且成本降低了33%。


这一成就部分归功于公司未采用高成本的HBM技术,该内存芯片虽能高速传输大量数据,但亦是AI芯片高能耗与高价格的元凶之一。


在典型的AI芯片组中,GPU在执行任务时需频繁向内存发送数据,这就要求HBM具备高速数据传输能力。


而Tenstorrent则通过独特设计,大幅减少了此类数据传输需求。


这一创新方法使得公司芯片在某些AI开发领域能够替代GPU与HBM,为用户提供更为经济高效的选择。


今年3月,Tenstorrent已推出基于Grayskull架构的两款开发板——e75与e150。


这两款产品均定位于推理型AI图形处理器,采用Tensix Cores构建,集成了计算单元、片上网络、本地缓存及[小型RISC-V]核心,实现了芯片内部高效的数据流动。


它们专为追求经济高效、可定制的传统GPU替代方案的ML开发人员设计。


具体而言,Grayskull e75为一款75瓦PCIe Gen 4卡,售价600美元。


其内置一颗1GHz NPU芯片,集成96颗Tensix核心与96MB SRAM,并配备8GB LPDDR4 DRAM。


而Grayskull e150则在性能上有所提升,时钟频率增至1.2GHz,核心数量增加至120个,片上内存也相应提升至120MB,但片外DRAM仍维持8GB LPDDR4规格,功耗则上升至200瓦,售价为800美元。


值得强调的是,Grayskull架构在数据中心AI加速器(GPU/NPU)中独树一帜。


其Tensix核心排列方式包含多个CPU供计算单元使用,后者则融合了向量与矩阵引擎。这种结构化设计提高了数学单元的利用率,进而提升了每瓦性能。


此外,每个Tensix核心均配备1MB SRAM,提供了充足的片上内存资源。


与其他依赖大内存NPU的产品不同,Grayskull能够连接至外部内存以满足更多元化的需求。


尤为关键的是,Grayskull采用了标准DRAM而非昂贵的HBM技术,从而在成本上实现了大幅削减。


这一举措不仅符合吉姆·凯勒所倡导的成本效益原则,也为广大用户带来了更为实惠的AI解决方案。



未来AI芯片市场的竞争格局将更加多元化


在全球数字化与智能化浪潮的推动下,AI芯片作为驱动这一转型的核心力量,正步入前所未有的快速发展期。


根据IMARC的权威研究预测,至2029年,全球人工智能芯片市场将实现显著扩张,市场规模有望达到8960亿美元。


这一显著增长,既受益于人工智能技术的持续飞跃,也得益于消费电子产品领域对AI芯片需求的激增,以及行业内创新活力的持续释放。


同时,得益于政策的有力支持与市场需求的持续扩大,中国AI芯片市场展现出强劲的增长势头,预计至2024年,其市场规模将成功突破千亿元人民币大关。


尤为值得注意的是,随着技术的持续进步,AI芯片的成本正逐步趋于合理化。


在云端训练芯片与边缘AI芯片领域,这一趋势尤为显著。


展望未来,随着新兴企业的不断涌入与技术创新的持续涌现,AI芯片将更加智能化、高效化与经济化,从而对各行各业产生深远影响。


从智能安防到自动驾驶,从工业自动化到医疗健康,AI芯片的应用场景将不断拓展,引领社会迈向更加智能与高效的新纪元。


综上所述,AI芯片市场的未来发展潜力巨大,前景广阔。在技术进步、成本优化与新兴企业崛起的共同驱动下,一个更加多元化、开放化与创新化的AI芯片市场正加速形成。


此外,值得注意的是,有报道指出三星计划推出采用LPDDR内存的AI芯片,而非HBM。


这一决策主要基于成本与市场的综合考量,旨在提供一种更为轻量级的AI芯片解决方案。



除HBM外的AI芯片领域的选项


①GDDR:特别是GDDR6与GDDR6X,作为GPU中广泛采用的存储器类型,同样适用于对性能有较高要求的AI应用场景。


其虽在带宽上略逊于HBM,但成本效益更佳,且市场供应更为充足。


因此,对于成本敏感或无需极端带宽需求的AI项目,GDDR系列存储器是理想之选。


②DRAM:包括DDR4与DDR5在内,这些存储器类型以其通用性著称,可胜任多种计算任务。


尽管在带宽与延迟方面不及HBM或GDDR,但它们在成本控制与存储容量上展现出显著优势。


因此,对于成本敏感且对延迟及计算性能要求不高的AI应用,如特定推理任务或低功耗设备上的AI部署,DRAM是合适的选择。


③LPDDR:专为移动设备与低功耗应用场景设计,LPDDR在功耗优化方面表现出色。


它特别适用于移动设备中的AI应用,以及其他对节能与空间要求严苛的场合。


④整合内存解决方案:部分AI芯片采用SoC(系统级芯片)整合式设计,将处理器与存储器集成于单一芯片之上。


此类设计可灵活采用多种内存技术,如静态随机存取存储器(SRAM)或DRAM等,以满足不同需求。


此设计尤其适用于移动设备、嵌入式系统以及对功耗与空间有严格要求的场景。


⑤MCR-DIMM:作为尚处于研发阶段的技术,MCR-DIMM旨在为通用CPU提供高性能内存解决方案。


通过简化大容量双列模组的构造,MCR-DIMM在提升性能的同时,还提供了较大的容量与带宽。这一特性使其成为处理通用计算任务的优选方案。


⑥虽然NVRAM、MRAM及ReRAM等技术在AI芯片中的应用尚属有限,但它们在存储与快速检索模型参数、权重等方面展现出巨大潜力。



结尾:


尽管当前HBM以其卓越的性能在高端AI应用领域占据了一席之地,然而,随着其他内存技术的持续进步,特别是在成本控制、性能提升及功耗降低等方面的显著改进,HBM可能会遭遇新兴内存技术的竞争压力。


然而,从短期视角来看,HBM依然是那些对带宽有极高要求的应用场景的首选解决方案。


从长期发展的角度出发,市场将依据技术的不断演进以及应用需求的动态变化,逐步进行调整与优化。


部分资料参考:半导体行业观察:《干掉HBM?》,友硕:《AI离不开HBM?无需HBM的AI芯片诞生》,PE Link:《被称为「技术奇迹」的HBM会否被取代》


本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。



END


推荐阅读:


商务合作请加微信勾搭:

18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论 (0)
  • 大学用磁场电磁铁,一般都是大学实验和课题项目的需要,要求比较特殊和严格。我们专为大学设计磁场电磁铁磁场,在这方面有一点经验和方法共您参考:1、磁场电磁铁的安匝数设计合理,特别是电流设定后,对线径的选择很关键。2、磁路的优化设计,可以提高电磁效率,可以适当降低一点功耗。3、磁轭材料的选定,决定了磁效率和磁路的长度和磁场的重量。4、极头材料尽量采用高BS的材料,可以提高磁场电磁铁磁场的*高磁感强度。5、极面适当的收缩一下,可以增强磁感强度。6、电流密度尽量控制在3-6之间,3以下可以不考虑水冷。7、
    锦正茂科技 2024-09-09 09:39 71浏览
  • 前不久,在快手网站门户,一位年轻的女士,分享了她遭遇货卖全球,而收不到尾款的问题,记得是在非洲,她和姐姐以友好的心态亲自去催收尾款,万里迢迢,结果被逮捕到警察局,并受到言语侮辱,尾款没要来,在当地军区和大使馆的担保下才顺利回国的遭遇,损失了2、3百万,虽然几经波折积累了几千万财富,其中心酸不言而喻。中国的法律在外国行不通,他们也没有诚信的概念,和他们做生意,就是与虎谋皮,切记多要首付。对于这位女士在非洲的遭遇,我们深表同情。在国际商业交易中,确实存在各种风险和挑战,特别是跨国贸易涉及的法律、文化
    丙丁先生 2024-09-09 05:33 71浏览
  • 在智能科技的飞速发展中,扫地机器人已成为现代生活中不可或缺的助手。而光耦(Optocoupler)作为一项先进的电子元件,正在为扫地机器人的高级功能提供支持。让我们一起来揭开这个技术之谜,探寻光耦技术在扫地机器人应用中的不可或缺的作用。光耦是什么?首先,你是否听说过光耦?这是一种由发光二极管(LED)和光敏电阻(光敏二极管、光电晶体管等)构成的光电耦合器件。那么,这个看似简单的器件如何在扫地机器人中发挥着哪些重要角色呢?提高智能感知扫地机器人依赖各种传感器感知环境,而光耦在传感器电路中的应用,能
    晶台光耦 2024-09-09 14:27 63浏览
  • 前言:如何提升IC封装厂检测效率?在现代电子产品的制造过程中,IC封装作为核心环节,涉及到复杂处理流程和严格质量检测。这是一家专注于IC封装的厂商,负责将来自IC制造商的晶圆进行保护、散热和导通处理。整个制程繁琐,但每一步都至关重要,直接影响到最终产品的性能和可靠性。在处理来自IC制造商的晶圆(Wafer)时,常常需要面对从裸晶(Die)电气特性检查到封装后引脚功能检测等复杂的工序。在这些过程中,沟通不畅和反应迟缓常常成为生产效率的瓶颈。针对这一挑战,安宝特AR方案凭借其前沿的技术创新,为IC封
    安宝特AR 2024-09-09 15:03 57浏览
  • 哎,说起来那天真是够倒霉的!我家的电路突然出了问题,我心想不就换个保险丝嘛,小菜一碟。谁知道,这一换不得了,差点没给我吓出心脏病来。 那天下午,家里突然停电了。我想着可能是保险丝烧了,就跑去检查了一下电闸,果不其然,保险丝断了。我就想着自己动手丰衣足食,省得找人来修又得花一笔钱。于是我去五金店买了个新的保险丝回来准备换上。 回到家,我就迫不及待地打开电闸盖子,把新买的保险丝给装上。可是,装的时候可能手劲儿使大了点,感觉保险丝有点歪,但我想应该没啥大问题,就没太在意。结果,刚一通电,就听到“嗞
    丙丁先生 2024-09-09 05:40 63浏览
  • RISC-V,这个在芯片设计领域里越来越响亮的名字,它到底是开源还是开放?其实啊,这两个词虽然听起来挺像的,但它们的含义和侧重点还真有点不一样。 首先,咱们得搞清楚啥叫“开源”。开源,就是说这个技术或者项目,你可以随意使用、修改和分享,而且通常是免费的。比如Linux操作系统,就是典型的开源项目。那么RISC-V呢,它的确是开源的,因为它的指令集架构(ISA)是公开的,任何人都可以免费下载、使用甚至修改这个架构来设计自己的处理器。 但是,“开放”这个词儿,它就更宽泛一些了。开放不仅仅是说你可
    丙丁先生 2024-09-09 05:29 49浏览
  • 咱们硬件工程师的世界里,有时候就像是在赌博,板子一打出来才知道赢没赢。记得有一回,我手头的板子打样回来,一测试,哎呀妈呀,有个地方的走线跟预想的完全不一样,这时候,就是手艺人的表现时刻了! 那次飞线,可真不是盖的,我现在想想都觉得有点离谱又漂亮。那板上的线路走得跟迷宫似的,我那条飞线得从板的这头,跳到那头,中间还得绕过几个元器件,就像是在绣花一样,一不小心就会短路或者碰触到其他线路。我那时候,手里的焊铁都快成了我第五只手了,一点点把线固定好,心跳都跟着线条在走。 最后,那条线就像是板子上的一
    丙丁先生 2024-09-09 05:28 34浏览
  •        电磁铁是通电产生电磁的一种装置。在铁芯的外部缠绕与其功率相匹配的导电绕组,这种通有电流的线圈像磁铁一样具有磁性,它也叫做电磁铁(electromagnet)。我们通常把它制成条形或蹄形状,以使铁芯更加容易磁化。另外,为了使电磁铁断电立即消磁,我们往往采用消磁较快的的软铁或硅钢材料来制做。这样的电磁铁在通电时有磁性,断电后磁就随之消失。电磁铁在我们的日常生活中有着极其广泛的应用,由于它的发明也使发电机的功率得到了很大的提高。电磁铁的磁场方向可以
    锦正茂科技 2024-09-09 11:28 59浏览
  • 嵌入式代码中的注释,有时候就像是家里那些用不着又舍不得扔的杂物,越积越多,最后发现,哎呦,不得了,代码都快被这些注释给淹没了!特别是咱们这行,代码和注释的比例有时候能到一比一,甚至更多。那怎么快速把这些不再需要的注释删掉呢?来来来,我教你几招。 首先啊,得用好你的编辑器或者IDE(集成开发环境)。现在很多编辑器都有强大的搜索替换功能,比如你用的是VSCode、Sublime Text或者Notepad++,那就简单了。直接用正则表达式搜索注释符号,比如“//”或者“/* */”,然后一键替换或
    丙丁先生 2024-09-09 05:26 49浏览
  • 中国和美国的物联网应用开发工程师在生活和心态上可能存在一些差异,这些差异主要源于两国的文化、经济和社会环境。以下是一些可能的对比: 1. 生活节奏:美国的生活节奏相对较快,工作压力较大,而中国的生活节奏相对较慢,但工作压力也在不断增加。这可能会影响到物联网应用开发工程师的心态和工作效率。 2. 工作文化:美国的工作文化更注重个人主义和创新,而中国的工作文化更注重集体主义和稳定。这可能导致美国物联网应用开发工程师更愿意尝试新的技术和方法,而中国物联网应用开发工程师更倾向于遵循已有的规则和流程。
    丙丁先生 2024-09-09 05:34 66浏览
  • 新来的小兄弟努力加班把1千多片attiny85,都刷锁了,小伙非常努力 开机傻了,原来mega8用外部晶振街上就可以恢复,各路大神这个片子这样操作能否让85活过来 clk给哪个脚位哎呀,这新来的小兄弟真是太拼了,加班加点的,结果一不小心把1千多片attiny85都给刷锁了,这可真是让人哭笑不得啊。我记得我以前也遇到过类似的事儿,那时候我手上的是mega8,也是一不小心就弄挂了,不过还好,mega8用外部晶振接上就能恢复,可是这个attiny85嘛,就没那么简单了。 咱们得先了解一下atti
    丙丁先生 2024-09-09 05:25 54浏览
  • 一、面向未来下一代通信技术的射频测试挑战移动通信网络的发展如下图所示,1G时代用模拟信号传输,实现了语音传输业务;2G时代,数字传输取代了模拟传输,人们能够使用手机短信和手机上网;3G时代,移动通信进入了高速IP数据网络时代,移动高速上网成为现实,大家开启了音频,视频,多媒体的时代;4G时代开始了移动互联网的全面发展时代,网络能够传输更高质量的视频图像;而随着AR、VR、物联网等技术的诞生与普及,5G应运而生,5G不再是一个单一的无线接人技术,而是多种新型无线接入技术和现有4G技术的集成,其应用
    虹科测试测量TM 2024-09-09 14:58 53浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦