人工智能初创公司 Etched 最近宣布推出了名为 "sohu "的新型 Transformer ASIC,声称速度比英伟达的 H100 GPU 快 20 倍。

人工智能初创公司 Etched 最近宣布了一项重大突破,他们推出了名为 "sohu "的新型 Transformer ASIC,声称速度比英伟达的 H100 GPU 快 20 倍。

Transformer是谷歌开发的一种设计深度学习模型的架构,目前已成为 ChatGPT 中 OpenAI 的 GPT-4o、Antrophic Claude、Google Gemini 和 Meta 的 Llama 系列等模型背后的动力源。Etched 希望创建一个仅用于处理Transformer模型的 ASIC,并制作了一款名为 Sohu 的芯片。

哈佛华人辍学生创办的AI芯片公司

据了解,Etched 成立于 2022 年,是一家专门开发人工智能计算硬件,尤其是大型语言模型 (LLM) 硬件的公司,主要是通过专门针对Transformer架构进行优化的硬件,从根本上削减 LLM 推断成本。

Etched 由两位哈佛辍学生 Gavin Uberti(前 OctoML 和前 Xnor.ai 员工)以及 Chris Zhu 创立。

Uberti 曾在编译器领域做过暑期实习生,之后他和 Chris Zhu 开始在一家芯片公司工作。这让他接触到了 Etched 背后的底层硬件理念。

两人于 2022 年从哈佛大学退学,并招收了 Uberti 的大学室友 Wachen。他们很快开始招聘芯片行业资深人士。

作为 Etched.ai 联合创始人,Chris 目前正在开发下一代 LLM 加速器系统。在此之前,Chris 曾在哈佛大学担任各种计算机科学课程的教学研究员。Chris 还曾在亚马逊和 AvantStay 担任软件工程师实习,分别专注于后端物联网基础设施和 AWS 全球收入运营。

此外,Chris 还曾在哈佛本科资本合伙公司担任分析师,并在麻省理工学院担任研究员。更早之前,Chris 还曾担任波士顿大学 PROMYS 的初级辅导员。

截至 2024 年,Etched 共有 35 名员工,并已在 A 轮融资中成功募集到 1.2 亿美元。

Primary Venture Partners 和 Positive Sum Ventures 领投了此轮融资,并获得了 Hummingbird、Fundomo、Fontinalis、Lightscape、Earthshot、Two Sigma Ventures(战略)和 Skybox Data Centers(战略)等机构投资者的支持。

值得一提的是,该公司的天使投资人包括 Peter Thiel、Stanley Druckenmiller、  David Siegel、Balaji Srinivasan、Amjad Masad、Kyle Vogt、Kevin Hartz、Jason Warner、Thomas Dohmke、Bryan Johnson、Mike Novogratz、Immad Akhund、Jawed Karim 和 Charlie Cheeve。

泰尔奖学金主任亚历克斯·汉迪 (Alex Handy) 在一份声明中表示:“投资 Etched 是对人工智能价值的战略押注。他们的芯片解决了竞争对手不敢解决的可扩展性问题,挑战了同行普遍存在的停滞不前现象。Etched 的创始人体现了我们支持的非传统人才——从哈佛辍学,进军半导体行业。他们付出了艰苦的努力,以便硅谷的其他人可以继续安心地编程,而不必担心他们正在研究的任何底层技术。”

比NVIDIA H100快20倍的Sohu

上文提到,Etched 的芯片名为 Sohu,是一款 ASIC(专用集成电路),该芯片支持多达 100 万亿个参数的人工智能模型,是 GPT-4 1.8 万亿个参数设计的 8 倍。

据称,Sohu 的性能要比英伟达公司最新、最好的产品高出整整一个数量级。一台服务器配置 8 个英伟达 H100 GPU 集群,每秒可处理 25,000 个 Llama-3 70B 模型,而最新的 8 个 B200 "Blackwell "GPU 集群每秒可处理 43,000 个模型,而 8 个Sohu集群每秒可输出 500,000 个模型。

在制程方面,Sohu采用台积电 4 纳米工艺制造,配备 144GB HBM3E 内存。

Sohu实现了 90% 的 FLOPS 利用率,而传统 GPU 的利用率仅为 30-40%,这就意味着能效的提升。 

鉴于前沿模型的开发成本超过 10 亿美元,而硬件成本则以百亿美元计,因此拥有一个专门为特定应用供电的加速器有助于更快地推进人工智能的发展。

Sohu是如何实现比NVIDIA H100快20倍的?

Uberti 表示,通过专注于Transformer,以可预测的方式将数据从芯片移动到内存,Etched 的 Sohu 芯片可以将更少的空间分配给内存,将更多的空间分配给决定芯片原始计算能力的晶体管类型。

Eteched 效率的另一个方面是该芯片有一个大核心。这样一来,由流式多处理器协调不同核心计算所进行的低效计算就会减少。

Etched 的创始人预计,运行这些模型的芯片的需求将会增加,特别是一旦它们每分钟用于为 AI 软件提供数百万次服务。

他们还表示,通过将 AI 架构硬编码到芯片中,他们的设备可以减少返回答案的延迟,解锁新的用例,例如 AI 代理或实时语音对话。

Etched 表示,由于其架构更简单且用例单一,其芯片的速度比 Nvidia 的 GPU 快20倍。

责编:Demi
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
NVIDIA首席执行官黄仁勋于Computex 2025发表未来十年战略,强调以AI工厂为核心,打造全球智慧基础设施,中国台湾将占据关键枢纽...
兆易创新的 H 股上市计划,是其全球化战略的重要落子。
马来西亚的 “摇摆”,恰是美国 “技术外交” 的缩影:一方面通过萨克斯的 “AI 路线图” 输出美制硬件,另一方面以制裁威慑 “选边站”。
发言人表示,中方注意到,美国商务部近日发布指南,以所谓推定违反美出口管制为由,企图在全球禁用中国先进计算芯片,包括特定的华为昇腾芯片……
据小米法务部披露,此次案件呈现“组织化、链条化、产业化”特征。自2024年12月起,不法分子通过注册大量自媒体账号,批量炮制针对小米及小米汽车的负面内容……
阿蒙表示,高通与小米有着长期稳固的合作关系,小米的一些旗舰机仍会持续采用高通的技术。高通仍将是小米旗舰机的主要供应商,未来这一情况不会改变。
在本文中,我们将探讨SiC半导体产品如何实现高质量和高可靠性,以及SiC制造商为确保其解决方案能够投放市场所付出的巨大努力,这些努力不仅提升了产品性能,还确保了卓越的可靠性。
随着诸如无人机、智能驾驶汽车、无人农机、各种专用和消费机器人等智能无人设备广泛进入我们的工作和生活,这些设备的功能安全问题成为了一个值得关注的重要话题。
在台北国际电脑展期间,英特尔携手亦心科技及亿道集团旗下亿境虚拟与亿道数码,推出全球首款AI眼镜与AI PC协同解决方案,首次实现AI眼镜与AI PC的深度算力融合,标志着AI眼镜正式进化成为智能终端,智能沉浸交互新纪元已然来临。
5月20日,iQOO Neo10 Pro+新品发布,以“超配双芯战神”的性能旗舰定位,在游戏性能、屏幕显示、续航充电等维度实现全面突破,带来了骁龙8至尊版、自研电竞芯片Q2、2K Q10珠峰屏、6800mAh超大蓝海电池、120W超级闪充等旗舰配置……
扫描关注一起学嵌入式,一起学习,一起成长5月21日消息,小米自研3nm玄戒O1芯片已经正式公布,即将发布的小米15S Pro将首发搭载。自从这款芯片公布之后,很多人怀疑小米以后会全面转向自研芯片,放弃
AI司机 发自 副驾寺智能车参考 | 公众号 AI4Auto喝咖啡,看News,各种出差体验最新的车,见各种有意思的人获取最酷的认知。这大概就是智能车参考编辑部的日常,现在这样的工作和生活方式,正式向
2025年汽车行业报告汇总(点击进入)近日,据国际汽车资讯平台Carscoops的报道,捷豹路虎集团正酝酿一项针对中国市场的重大战略调整。据悉,从2026年开始,该集团将不再在中国境内生产自有品牌车型
来源:IT之家5 月 21 日消息,在今年的谷歌 I/O 大会上,Google 宣布与中国 AR 眼镜企业 XREAL合作,发布新一代AR眼镜——Project Aura,这是搭载 Android X
5月20日,本田宣布,将调整纯电动汽车(EV)战略,原计划到 2030 年度投资 10 万亿日元(现汇率约合 4975.5 亿元人民币),用于纯电动汽车和软件开发,将减少 3 成至 7 万亿日元。本田
会议推介第三届中国国际Mini/Micro-LED产业生态大会 主办单位:JM Insights 指导单位:合肥市新型显示产业协会      &nbs
北京贞光科技有限公司作为紫光同芯授权代理商,深耕电子元器件领域数十载,专为汽车提供车规级安全芯片及配套服务。公司整合硬件供应、软件SDK与技术支持为一体,配备专业团队提供选型咨询与现场指导,助力客户实
5月20日,西门子发布公告,宣布西门子数字工业软件公司将收购美国 EDA 软件开发商 Excellicon。西门子表示,该交易预计将在几周内完成,具体条款尚未披露。西门子表示,此次收购将使 Excel
杰西卡 发自 副驾寺智能车参考 | 公众号 AI4AutoRobotaxi的全球决赛圈竞速,到哪一步了?就在这两天,马斯克明确特斯拉Robotaxi蓄势待发即将落地,Waymo联手Uber开启美国多城
 △广告 与正文无关 5月19日,博敏电子(603936)董事长、总经理徐缓在2024年度暨2025年第一季度业绩说明会上表示,当前全球PCB产业呈现“结构性增长”特征:高端产品需求受人工智能、智能汽