基于SambaNova的SN40L的8芯片系统,可以为5万亿参数模型提供支持,单个系统节点上的序列长度可达256k+。对比英伟的H100芯片,SN40L不仅推理性能达到了H100的3.1倍,在训练性能也达到了H100的2倍,总拥有成本更是仅有其1/10。

近日,在Hot Chips 2024大会上,美国AI芯片初创公司SambaNova首次详细介绍了其新推出的全球首款面向万亿参数规模的人工智能(AI)模型的AI芯片系统——基于可重构数据流单元(RDU)的AI芯片SN40L。

SambaNova Systems公司CEO Rodrigo Liang  图源:SambaNova

2023年9月,SambaNova推出了这款新型人工智能(AI)芯片SN40L。该芯片专门为运行企业应用程序的大型语言模型而构建,其设计目标是能承载ChatGPT高级版本两倍容量以上的大模型。SN40L芯片能够为5万亿个参数的模型提供动力,并包含两种高级形式的内存。

据悉,基于SambaNova的SN40L的8芯片系统,可以为5万亿参数模型提供支持,单个系统节点上的序列长度可达256k+。对比英伟的H100芯片,SN40L不仅推理性能达到了H100的3.1倍,在训练性能也达到了H100的2倍,总拥有成本更是仅有其1/10。

据介绍,SambaNova SN40L芯片采用台积电,拥有1020亿个晶体管,包含1040个核心,1040个自研的“Cerulean”架构的RDU计算核心,整体的算力达638TFLOPS(BF16)。

虽然638TFLOPS的算力在市场上并非绝对最高,但该芯片通过三层数据流存储器的配置,包括520MB的片上SRAM内存(远高于此前Groq推出的号称推理速度是英伟达GPU的10倍、功耗仅1/10的LPU所集成的230MB SRAM),集成的64GB的HBM内存,1.5TB的外部大容量内存,使其能够支持万亿参数规模的大模型的训练和推理。

实际应用中,SN40L在生成文本、处理图像以及运行大规模AI模型时表现出色。尤其在生成自然语言方面,每秒可以高达1100个Token的生成速度,极大地提高了AI应用的效率。

SambaNova Systems是一家位于美国加州帕洛阿尔托的初创公司,专注于人工智能芯片和数据分析软件的开发。该公司成立于2017年,由行业知名人士创立,旨在通过软硬件结合的方式提供一整套解决方案,帮助企业客户在AI领域取得突破。

相关信息显示,SambaNova Systems在2019年春季筹集了1.5亿美元的D轮融资,由软银投资牵头。该公司在2021年4月又筹集了6.78亿美元的D轮融资。截至2023年,SambaNova Systems已经筹集了超过11亿美元的风险投资。

责编:Jimmy.zhang
阅读全文,请先
您可能感兴趣
目前AI芯片设计人员通常会在系统CPU旁边集成单独的IP模块,以满足AI日益增长的需求。这种方法导致了AI芯片的配置不够理想,因为通常需要依赖三家不同的IP供应商和三套工具链,这不仅使得功率、性能和面积(PPA)指标较差,也增加了适应新算法的难度。
尽管在生态系统建设、软件支持和安全性问题等方面,RISC-V仍需不断努力和完善,但凭借简洁高效、灵活多样的特点,RISC-V目前已经在嵌入式系统、云计算与大数据、人工智能与机器学习、物联网与边缘计算等领域展现出了强大的生命力和广阔的发展前景。
加文・纽森最终否决SB 1047,意味着这个被视为美国乃至全球首个专门针对AI模型安全性和透明度的法律框架并未成为正式法律。不过,归根结底是这项法案确实存在诸多争议的地方。
除了软硬件的开发之外,地瓜机器人也希望通过提供高效、易用的开发工具和平台,聚合优质产业资源,降低机器人开发的门槛,从而推动更多创新应用的出现,最终实现其成为“机器人时代母生态”的愿景。
根据“阿联酋2031”,该愿景旨在将该国的国内生产总值(GDP)从1.49万亿迪拉姆翻一番至3万亿迪拉姆。在这一项塑造未来10年国家未来的国家计划中,在AI技术方面的投资与发展将成为阿联酋经济发展重要的一环。
曾在美国国务院从事科技政策工作的里克·斯威策(Rick Switzer)就指出,“中国可以创新,他们一直在创新,他们并没有靠偷窃来获得创新,他们实际上是通过非常努力的工作才取得现在的成就的。”
所有智能出行系统产品都需要新的计算、通信和连接芯片的支撑,但是随之而来的是这些芯片的系统级故障或意外行为可能引起的危险。
受全球经济衰退影响,高端显示面板需求下滑,导致大尺寸OLED出货量在2023年同比下降了 25.7%。唯一的例外是OLED显示器……
香港应用科技研究院(应科院)将于10月13至16日参与由香港贸易发展局(香港贸发局)主办的「香港秋季电子产品展」,向全球数以万计的专业买家和业界代表,展示一系列崭新智能出行科技。
启发式排程、模拟排程和优化排程都可以帮助您改善工厂 KPI,每种方法都有其优点和缺点。您应该充分了解这些排程方法的适用性和能力,以确保在您的工厂成功实施。
会议推介2024深圳国际MLED直显产业高峰论坛暨COB显示屏调研白皮书启动仪式 主办单位:JM Insights 联合主办单位:DISCIEN(迪显咨询) 论坛时间:2024年10月31日 论坛地点
会议推介2024深圳国际MLED直显产业高峰论坛暨COB显示屏调研白皮书启动仪式 主办单位:JM Insights 联合主办单位:DISCIEN(迪显咨询) 论坛时间:2024年10月31日 论坛地点
汽车芯片设计资料包昨日美股收盘,Mobileye股价大跌4.64%、收12.33美元,年初迄今累计重挫71.54%。摩根大通分析师Samik Chatterjee 10月7日出具最新报告,看衰Mobi
会议推介2024深圳国际MLED直显产业高峰论坛暨COB显示屏调研白皮书启动仪式 主办单位:JM Insights 联合主办单位:DISCIEN(迪显咨询) 论坛时间:2024年10月31日 论坛地点
来源:猛兽财经   作者:猛兽财经 猛兽财经核心观点: (1)小米集团的股价已经上涨到了2022年以来的最高点。 (
引言 Omdia 物联网(IoT)企业调查的最新结果显示,利用物联网解决方案的企业信心大增。企业继续将物联网整合到工作流程中,同时从提高生产率、节约成本到改善工人安全等方面获得收益。第六次年度调查包括
 智能汽车网络与数据安全新媒体 (谈思汽车讯)欧盟成员国4日表决未能阻止对华关税提案,欧盟委员会将对中国进口电动汽车加征所谓反补贴关税。不过,欧委会同时声称,将继续与中方谈判,探索“替代解决方案”。当
  功率放大器是电子设备中一种关键的元件,其主要作用是将弱信号放大到足够大的幅度,以驱动负载,例如扬声器、电动机或其他高功率设备。下面将详细介绍功率放大器的用途以及它在各个领域中的
致远电子GXF222-4G网关,专为工业及特种车辆数据监测设计,采用RISC-V架构,无缝连接IOT云平台,CAN/485通信强,高效4G传输,DIDO精准远控,实现远程数据即时透传与高效管理。面对工
▼关注微信公众号:硬件那点事儿▼Part 01前言前两篇文章我们讲述了运算放大器输入偏置电流,输入失调电流,输入失调电压作为运放输入特性参数中比较重要的特性参数之一,当然也是需要重点关注的,我们今天会