尽管WSE-3芯片核心数量、缓存容量增加的不多,但性能实现了飞跃,峰值AI算力高达125PFlops,也就是每秒12.5亿亿次浮点计算,堪比顶级超算。目前WSE-3的具体功耗、价格没公布,参考上一代产品的价格,估计该芯片价格要超过200万美元,不知会有多少企业愿意买单。

随着AI模型的大规模应用,芯片的算力需求越来越高,对芯片制造工艺也提出了更大的挑战。3月14日,美国芯片初创公司Cerebras Systems发布了第三代晶圆级AI加速芯片“WSE-3”(Wafer Scale Engine 3),其规格参数更加疯狂,而且在功耗、价格不变的前提下性能翻了一番。

据悉,这款芯片的单颗面积达到了约46225平方毫米,是通常芯片面积的50倍以上,比一本书的面积还要大。造成这一差异的主要原因在于Cerebras Systems走了不同寻常的制造工艺路线,即在普遍芯片制造商的制造流程还是从硅锭切下一片晶圆并将其分割成数百颗独立芯片时,Cerebras Systems选择直接将整片晶圆做成一颗芯片。

这种制造工艺也导致单颗芯片的面积与12英寸晶圆所能截取的矩形面积一样大,而Cerebras Systems生产的芯片也以"巨大"著称。

据悉,2019年8月,Cerebras Systems发布了Wafer Scale Engine(WSE)系列的首款芯片,该芯片集成了1.2万亿个晶体管,40万个AI核心。

2021年4月,Cerebras Systems又推出WSE-2。其官方数据显示,第二代芯片拥有2.6万亿个晶体管和85万个核心,相较第一代晶体管数、内核数、内存等增加一倍以上。其核心面积就已经达到了46225平方毫米,是彼时最大的GPU核心面积的56倍。2022年,Cerebras Systems生产的芯片被硅谷计算机历史博物馆收藏。

而WSE-3芯片是专为训练业界最大的AI模型而构建的。这款新器件使用台积电的5纳米工艺打造,包含4万亿个晶体管,90万个AI核心。而相比之下,英伟达H100芯片所包含的晶体管数量为800亿个。

图源:Cerebras Systems

Cerebras Systems表示,WSE-3芯片性能参数全面对标英伟达H100。其公司介绍页信息显示,在人工智能训练加速方面,该芯片的性能是H100的8倍。

该公司在新闻稿还介绍,"您可能已经看到Cerebras表示其平台比NVIDIA的平台更易于使用。造成这种情况的一个重要原因是Cerebras存储权重和激活的方式,并且它不必扩展到系统中的多个GPU,然后扩展到集群中的多个GPU服务器。"

尽管WSE-3芯片核心数量、缓存容量增加的不多,但性能实现了飞跃,峰值AI算力高达125PFlops,也就是每秒12.5亿亿次浮点计算,堪比顶级超算。

目前WSE-3的具体功耗、价格没公布,参考上一代产品的价格,估计该芯片价格要超过200万美元,不知会有多少企业愿意买单。

不过,值得一提的是,Cerebras Systems很受资本青睐,包括OpenAI创始人山姆·奥尔特曼(Sam Altman),AMD前CTO Fred Weber以及Benchmark、Coatue Management、Eclipse Ventures等,都是该企业的投资人或机构。

2021年,Cerebras Systems获得最新一笔融资,由Alphawave Ventures和阿布扎比增长基金(ADG)领投,融资金额2.5亿美元。截至该轮融资,Cerebras融资总额7.2亿美元,公司估值超40亿美元。

责编:Jimmy.zhang
阅读全文,请先
您可能感兴趣
量子计算利用了三种关键量子原理:叠加、纠缠和干涉。这些概念在量子计算机中发挥着根本作用,从而使得量子计算机与传统计算机有很大不同。
尽管有着积极的预测,人工智能半导体领域仍面临持续的挑战,特别是在性能和功效方面。因此需要进一步努力加强和完善设计,使基于人工智能的工作负载能够低功耗执行。
为了克服CPU和GPU的限制,为人工智能推理工作负载专门设计的创新型硬件加速器,可实现高效和优化的处理,同时最大限度地减少能耗。
蔡崇信表示,中国目前与顶尖大型语言模型(LLM)的差距约为两年,但他看好中国的消费市场及人工智能(AI)的发展前景,“中国有能力自主制造高端 GPU 芯片,不一定依赖于英伟达”。
生成式人工智能应用的爆炸式增长,刺激了对人工智能服务器和处理器的需求飙升。目前,这些处理器中的大多采用计算式GPU,如英伟达的GPU。但随着DSP算法的快速发展,DSP是否也能满足AI处理器应用?这些高性能算法是否能够助力DSP取代GPU呢?针对这些问题,且看本文作者的观点分析。
GPU在游戏、专业视觉之类的图形应用之外,还广泛用在通用计算加速、数据中心领域。不过如果追本溯源去看GPU的“初心”,用于图形渲染的GPU又发展到哪儿了呢?它和通用计算乃至AI计算的GPU市场比起来如何?
此次GTC上新推出的用于AI/ML计算或者大模型的B200芯片有一个显著的特点,它与传统的图形渲染GPU大相径庭并与上一代用于AI/ML计算的GPU很不一样。
在现代制造业中,仅依靠制造执行系统(MES)、设备自动化系统(EAP)、高级计划排程系统(APS)、实时派工系统(RTD)等各种管理系统,还远远不够。工程智能(Engineering Intelligence, EI)作为半导体工业软件体系的核心环节,正扮演着越来越重要的角色……
凌华科技EGX-PCIE-A380E 集成了Intel Arc GPU,是一款性能强大且高效的PCIe Gen4独立显卡
支持软件开发团队在虚拟硬件平台上进行固件和MCAL开发
文|萝辑怎么简单直白地评价智己L6呢?蹭个热点吧,就是小米SU7的核心优点它都有,而SU7所有让人难受、别扭的地方,它都解决了。虽然车圈的价格战已经打了好几轮,但是小米SU7的上市,还是可以看成一个重
4月9日,金山办公生产力大会在京举行,现场发布了面向组织和企业的办公新质生产力平台WPS 365,其包含升级的WPS Office、最新发布的WPS AI企业版和WPS协作。WPS 365打通了文档、
点击上方蓝字谈思实验室获取更多汽车网络安全资讯 线下交流  专业社群  精品活动推荐 更多文章不要错过哦,这可能是汽车网络安全产业最大的专属社区!关于涉嫌仿冒AutoSec会议品牌的律师声明一文带你了
4月8日晚间,士兰微发布2023年年度报告,其中发光二极管板块营收同比增长,LED 芯片销售额较去年同期有一定幅度的增长;部分业绩信息如下:◆ 营收:93.40亿元,同比↑12.77%;◆ 净利润:亏
近日,海能达在其官网发布公告称“根据美国法院的法令,在另行通知之前,海能达不得在世界任何地方销售任何含有对讲机技术的产品”。从美国法院法令文件来看,这是一份藐视法庭制裁令。4月8日,海能达发布“关于重
OpenAI全面开放ChatGPT,将进一步刺激高效运算需求成长,引爆数据中心需求激增。大宗商品贸易商托克(Trafigura)表示,到2030年,与人工智能(AI)和数据中心相关的铜需求可能会达到1
插播:6月14日,行家说碳化硅大会即将在上海举办,报名请点击文末“阅读原文”。昨天,士兰微发布了最新财报,其中SiC业务成绩亮眼,预计2024年销售额将达到 10 亿元人民币。据了解,天岳先进、天科合
此前研究机构预测:当前笔记本电脑整体需求偏弱,品牌缺乏出货动能,因此预计2024年一季度全球笔记本电脑出货季减5.4%,主要原因是中国台湾代工厂一季度整体衰退幅度大于整体市场。但实际根据研究机构IDC
插播:6月14日,汽车碳化硅大会即将在上海举办,报名请扫上方二维码随着全球新能源汽车市场的蓬勃发展,比亚迪、宝马近日均宣布了其在电池技术及生产领域的重大进展:比亚迪:一汽弗迪旗下PA75动力总成电池项