作为继H100之后的升级产品,H200芯片性能更强大,适用于各种人工智能应用场景。它可以用于训练和部署各种大型语言模型、图像识别、语音识别等人工智能模型。在推理或生成问题答案时,性能较H100提高60%至90%。

图源:英伟达

近日,芯片巨头英伟达发布了H100芯片的继任者,也是目前世界最强的AI芯片——H200。这是英伟达新一代的GPU,专为训练和部署各种人工智能模型而设计。

作为继H100之后的升级产品,H200芯片性能更强大,适用于各种人工智能应用场景。它可以用于训练和部署各种大型语言模型、图像识别、语音识别等人工智能模型。在推理或生成问题答案时,性能较H100提高60%至90%。

H200H100有较大性能提升

该芯片直接采用141GB大内存,与H100的80GB相比直接提升76%。而作为首款搭载HBM3e内存的GPU,内存带宽也从3.35TB/s提升至4.8TB/s,提升43%。在HBM3e加持下,H200让Llama-70B推理性能几乎翻倍,运行GPT3-175B也能提高60%。

H200的性能提升最主要体现在大模型推理表现上,H200 在700亿参数的Llama2大模型上的推理速度比H100快了一倍,而且在推理能耗上H200相比H100直接降低了一半。

对于显存密集型HPC应用,H200更高的显存带宽能够确保高效地访问操作数据,与CPU相比,获得结果的时间最多可提升110倍。

不仅如此,H200与H100一样都是基于英伟达Hopper架构打造,这也意味着两款芯片可以互相兼容,对于使用H100企业而言,可以无缝更换成最新的H200。

整体来看,由于NVIDIA Hopper架构、TensorRT-LLM专用软件等软硬件技术加持,新的H200在超大模型训练和推理性能表现优异。与H100相比,H200在Llama 2(700亿参数)开源大模型的推理速度几乎翻倍,而未来的软件更新预计会带来H200的额外性能领先优势和改进。

据英伟达数据,在TF32 Tensor Core(张量核心)中,H200可达到989万亿次浮点运算;INT8张量核心下提供3,958 TFLOPS(每秒3958万亿次的浮点运算)。

不仅如此,基于H200芯片构建的HGX H200加速服务器平台,拥有 NVLink 和 NVSwitch 的高速互连支持。8个HGX H200则提供超过32 petaflops(每秒1000万亿次的浮点运算)的FP8深度学习计算和 1.1TB 聚合高带宽内存,从而为科学研究和 AI 等应用的工作负载提供更高的性能支持,包括超1750亿参数的大模型训练和推理。

忽略“算力”升级,切中AI推理

客观来说,H200相较H100在算力方面提升并不明显。从英伟达给出的数据来看,在GPT-3175B大模型的训练中,H200只比H100强了10%。正如有人所评论,H200可能只是H100的一个“中期改款”。

然而,在各大科技企业从训练模型转向推理之后,H200转而重点提升推理方面的能力,又足以说明英伟达切中了“要点”——刀法依旧精准。对此,有人评论H200在推理方面重点发力的意义:

一是提升AI性能:H200芯片在处理大型AI模型时的性能有了显著提升,这标志着英伟达继续在AI芯片领域保持领先地位。对于需要处理大量数据、进行复杂计算的AI应用来说,这无疑是一个重大利好。

二是加速AI应用落地:在H200芯片的帮助下,大语言模型Llama 2的推理速度翻倍,这意味着AI应用能够更快地投入使用,为企业和组织带来更高效的工作流程。

三是推动AI创新:H200芯片的性能提升,将鼓励更多的企业和研究机构进行AI创新。例如,它可以帮助企业更快地进行语言翻译、图像识别、自然语言处理等任务,从而提升工作效率和创造力。

四是促进AI人才培养:随着AI技术的不断发展,对相关人才的需求也在不断增加。H200芯片的发布,将进一步推动AI领域的人才培养。英伟达作为全球领先的AI芯片制造商,其产品和技术一直处于行业前列,这将为相关人才提供更好的学习和发展机会。

五是增强英伟达的市场竞争力:H200芯片的发布,进一步巩固了英伟达在AI芯片市场的领先地位。随着AI技术的不断发展和应用,AI芯片市场的竞争也将越来越激烈。英伟达通过不断推出性能卓越的AI芯片,将能够在市场竞争中保持领先地位。

因此,英伟达发布世界最强AI芯片H200,性能飙升90%,Llama 2推理速度翻倍,这一事件对于推动AI技术的发展、加速AI应用落地、促进AI人才培养以及增强英伟达的市场竞争力都具有重要意义。

H200价格会更高

英伟达表示H200预计将于2024年第二季度出货,但售价还暂未公布。据美国金融机构Raymond James透露,H100芯片成本仅3320美元,但英伟达对其客户的批量价格仍然高达2.5万至4万美元。这导致H100利润率或高达1000%,成为了有史以来最赚钱的一种芯片。而H200市场表现也将不遑多让,毕竟在当前算力荒的行业背景下,一些科技企业必然会疯狂扫货,而性能加量后的H200的价格只会比H100高。

英伟达官网显示,NVIDIA H200将为40多台AI超级计算机提供支持。包括CoreWeave、亚马逊AWS、谷歌云、微软Azure、甲骨文云等公司将成为首批部署基于H200实例的云服务商。同时,华硕、戴尔科技、惠普、联想、Supermicro、纬创资通等系统集成商也会使用H200更新其现有系统。

责编:Jimmy.zhang
阅读全文,请先
您可能感兴趣
据WSTS最新公布的预测报告显示,因生成式AI普及、带动相关半导体产品需求急增,且存储需求预估将呈现大幅复苏,因此将2024年全球半导体销售额预估值自前次(6月6日)预估的5,759.97亿美元上修至5,883.64亿美元、将年增13.1%,超越2022年的5,740.84亿美元、创历史新高。WSTS预测,2024年全球半导体市场可望复苏,存储芯片营收将激增44.8%,是推升半导体营收成长主要动能。
对于一颗车规级大芯片而言,为了确保设计的正确性,必须在生产制造前进行大规模的仿真和验证,而芯片的算力规模越大、集成度越高,仿真验证的过程就会越复杂,设计人员需要更快地实现收敛和验证,来降低成本并提高结果质量。同时,传统的随机/自动测试模式生成(ATPG)方案在故障覆盖率方面已经不能满足实际需求。因此,将 AI 和 EDA 融合是大势所趋。
联发科技(MediaTek)近日在加利福尼亚州拉古纳尼盖尔(Laguna Niguel)举行了年度高管峰会。峰会上强调了其以人工智能(AI)为驱动的高端定制 SoC(ASIC)战略;从 Wi-Fi 7 芯片到 5G 和 5G RedCap 瘦调制解调器的全新连接解决方案,凸显了其物联网战略和发展势头。
有专家认为,背后应有美国因素,基于地缘政治风险考虑,希望让日本成为具有3纳米芯片制造能力的经济体。不过,鉴于在美国亚利桑那州工厂的尴尬境地,台积电必然会深思熟虑一番。
自ChatGPT带火AI以来,AI芯片得到了空前的发展,十月底高通发布了基于Arm架构的带有AI算力的骁龙X Elite芯片。刚刚,Arm宣布将在2024年推出Cortex-M52芯片,为低功耗物联网设备带来AI加速功能。
目前芯擎科技已经实现了国内首款7nm工艺制程高算力智能座舱SoC产品“龍鹰一号”批量量产,一举打破先进制程产品被海外厂商垄断的市场局面。该芯片已首发于2023年领克08车型量产上车,可实现了人脸识别与驾驶行为监控、电子后视镜、自动泊车、行车记录与驾驶辅助提示、虚拟智能助手、安全OTA与车联网等多维度智能座舱应用。
据最新HBM市场研究显示,为了更妥善且健全的供应链管理,NVIDIA也规划加入更多的HBM供应商,其中三星(Samsung)的HBM3(24GB)预期于今年12月在NVIDIA完成验证。而HBM3e进度依据时间轴排列如下表所示,美光(Micron)已于今年7月底提供8hi(24GB)NVIDIA样品、SK海力士(SK hynix)已于今年8月中提供8hi(24GB)样品、三星则于今年10月初提供8hi(24GB)样品。
受智能手机产量下滑,以及品牌厂搭载趋势改变的影响,预估2023年智能手机相机模组出货量年减幅度将再扩大至8.9%,约40.65亿颗。而经过一年的库存去化,在2024年智能手机生产量有望恢复的预期下,明年智能手机相机模组市场有望恢复成长,出货量年增率预估3%,约41.71亿颗。
近日,武汉芯源半导体正式发布首款基于Cortex®-M0+内核的CW32A030C8T7车规级MCU,这是武汉芯源半导体首款通过AEC-Q100 (Grade 2)车规标准的主流通用型车规MCU产品。
1200 V分立器件提供出色的性能,有助于加速全球能源转型
第六届半导体大硅片论坛将于12月7-8日在上海召开,来自新昇、超硅、上海集成电路协会、KLA等公司的专家将带来精彩报告工业参观:半导体大硅片企业上海新昇半导体与上海超硅半导体,目前新昇名额已满11月3
『这个知识不太冷』系列,旨在帮助小伙伴们唤醒知识的记忆,将挑选一部分Qorvo划重点的知识点,结合产业现状解读,以此温故知新、查漏补缺。在过去十年中,移动无线数据快速增长,使得运营商愈加迫切地需要新频
在技术飞速进步的今天,物联网(IoT)以其深远的连通性和巧妙的数据处理能力,正成为引领变革的力量。原始设备制造商(OEM)站在一个关键的十字路口,他们不仅需要思考如何将IoT的力量融入现有产品,提升智
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,11月30日,宁德时代首席科学家吴凯在2023国际汽车电子与软件大会·滴水湖峰会上透露,目前,宁德时代旗下时代智能开发的滑板底盘已实现技术突破
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,根据财联社的报道,全美3000多家汽车经销商组成的联盟11月28日向拜登发出一封公开信,呼吁他在电动汽车推广政策上踩刹车。该联盟在信中写道,这
  大型电子工业洁净厂房的防火设计至关重要,以确保生产设备、人员和财产的安全。以下是合洁科技电子洁净工程公司总结的一些常见的防火设计分析要点。   
Dear customers and vendors, welcome to the Market Insights-Newsletter from Quiksol that delivers tim
芯片超人现有1600平米芯片智能仓储基地,现货库存型号1000+,品牌高达100种,5000万颗现货库存芯片,总重量10吨,库存价值高达1亿+。同时,芯片超人在深圳设有独立实验室,每颗物料均安排QC质
当我们谈起日本半导体,会想到什么?上个世纪80年代,日本曾是世界最大的半导体生产国。90年代初,全球前10大半导体公司中,有6家来自日本。如今,日本DRAM“国家队”尔必达已经破产,NEC、东芝、日立
由亚化咨询主办的第六届半导体大硅片论坛将于12月7-8日在上海召开。来自新昇、超硅、上海集成电路协会、KLA等公司的专家将带来精彩报告工业参观:半导体大硅片企业上海新昇半导体与上海超硅半导体,目前新昇