2025 年 4 月 16 日,英伟达(Nvidia)在提交给交易委员会(SEC)的 Form 8-K 文件中披露,美国政府已对其专为中国市场设计的 H20 芯片实施 “无限期出口禁令”。这款基于 Hopper 架构的 AI 加速器,单卡FP8算力从旗舰产品H100的1980 TFLOPS降至520 TFLOPS,但凭借高带宽与集群部署能力,2025 年前三个月已为英伟达贡献 160 亿美元销售额,占其全球 AI 芯片营收的 40%。禁令直接导致英伟达计提 55 亿美元损失,相当于其 2024 年中国市场总营收的 32%。
为应对这一危机,英伟达 CEO 黄仁勋于 4 月中旬紧急访华,与字节跳动、阿里巴巴、腾讯三家科技巨头闭门磋商。据《The Information》披露,黄仁勋在会议中展示了三套技术方案:通过降低 NVLink 互连速率、缩减带宽等技术微调规避监管红线;转向专为 AI 推理优化的 ASIC 架构;以及基于 Blackwell 架构开发全新 “中国特供版” 芯片。
技术路线抉择:GPU还是 ASIC?
面对美国商务部设定的 “算力阈值”(单精度浮点算力≤1.12 PFLOPS),英伟达陷入两难困境。
若继续沿用 GPU 架构,需将芯片算力压缩至 H100 的 10% 以下,这会导致其单卡性价比甚至低于华为昇腾 910B 等国产竞品。而转向 ASIC路线,虽能通过深度定制提升能效比,却意味着放弃 CUDA 生态的垄断优势 —— 该平台目前控制着全球 90% 的 AI 开发框架。
根据财联社、台湾《工商时报》等媒体报道,英伟达已启动代号为 “Blackwell 中国版” 的新一代 AI 芯片研发,样品预计最快 6 月交付测试。这款芯片将基于 Blackwell 架构,通过调整 NVLink 互连速率(从 900GB/s 降至 600GB/s)、缩减显存带宽(从 3.35TB/s 降至 2.2TB/s)等方式,将算力控制在 1.12 PFLOPS 以下。与此同时,英伟达同步研发 Blackwell Ultra 的 “中国专属版本”,计划通过集群部署弥补单卡性能不足。
国产替代加速
中国是英伟达重要的销售市场之一,2024年英伟达在中国市场实现销售额高达171.1亿美元,占公司1305亿美元总营收的大约13%。仅字节跳动、阿里巴巴、腾讯三家中国科技巨头,在今年前3个月就订购了价值逾160亿美元的H20 AI芯片。
然而美国的出口管制,客观上加速了中国 AI 算力的自主化进程。据中国信通院数据,2024年中国AI算力市场规模同比增长45%,但受限于高端芯片短缺,部分企业被迫转向国产替代方案或降低训练规模。
华为云最新推出的 CloudMatrix 384 算力集群,基于 384 颗昇腾芯片构建,通过全互连拓扑架构实现 300 PFLOPs 的密集 BF16 算力,接近英伟达 GB200 NVL72 系统的两倍。北京市人民政府官网数据显示,摩尔线程的 MTT S80 游戏显卡已在金融、教育、工业等领域实现规模化应用,其夸娥万卡智算集群解决方案支持万亿参数大模型训练,MFU(模型利用率)最高达 60%。
行业数据显示,中国移动建成国产化率 85% 的智算中心,单集群部署 1.8 万张国产 AI 加速卡;华为昇腾云服务通过架构创新,将 2 万张国产芯片的集群算力提升至 6.7EFLOPS。这些案例表明,中国 AI 产业正通过系统级优化弥补单卡性能差距。
地缘政治与商业利益的博弈
英伟达的困局折射出中美科技战的复杂生态。
在技术层面,美国商务部工业与安全局(BIS)的出口管制清单已形成动态压制机制,任何达到特定算力阈值的芯片都会自动触发禁售。美国国会议员计划在未来几周内提出立法,要求英伟达生产和售出的AI芯片具备位置验证功能。这一立法旨在追踪芯片位置,确保其符合出口管制许可下的授权用途,并防止未经适当授权的芯片启动运作。尽管这一计划在技术实作上较为复杂,但它显示了美国在AI芯片出口管制方面的进一步意图。
在市场层面,中国国家市场监管总局的反垄断调查直指英伟达捆绑销售、歧视性定价等行为,最高可处 50 亿美元罚款。在产业层面,中国四大行业协会联合声明 “美国芯片不再安全可靠”,有望推动AI芯片国产替代率进一步提升。
面对双重压力,英伟达在中国市场推出 “合规优先” 的特供芯片,并与本土企业合作开发定制化解决方案。黄仁勋在 5 月 3 日的公开声明中明确表示:“中国拥有占全球一半的 AI 研究人员,在 AI 堆栈的每一层都有能力强大的专家。美国无法通过监管机构赢得这场竞赛,英伟达将继续优化产品体系服务中国市场。”
行业展望
半导体行业观察人士指出,英伟达的技术调整可能重塑全球 AI 芯片竞争格局。若 Blackwell 中国版芯片顺利量产,其性能虽不及 H20,但凭借 CUDA 生态优势仍可能占据中低端市场份额。而华为昇腾、摩尔线程等国产厂商则在高端市场加速突破,例如华为云 CM384 已实现对英伟达 GB200 NVL72 的性能超越。
根据德勤中国最新发布的《技术趋势2025》报告预测,到2025年底,全球AI芯片市场规模将超过1500亿美元,并有望在2027年达到4000亿美元的高峰。在这场算力竞赛中,英伟达的 “特供策略” 与国产替代的 “自主化浪潮” 将长期共存,而最终的胜负手可能取决于软件生态的构建能力 —— 正如黄仁勋所言:“AI 的未来属于能够持续创新的企业,而非监管机构的禁令。”
