2025 年 4 月 29 日,北京市正式发布《促进民营经济健康发展、高质量发展 2025 年工作要点》,明确提出对采购自主可控 GPU 芯片开展智能算力服务的民营企业按投资额一定比例给予支持,并鼓励参与绿色创新平台及智算中心项目。
这一政策是北京市落实《算力基础设施建设实施方案 (2024—2027 年)》的重要举措,该方案明确提出,到2025年北京市智算供给规模需达45EFLOPS,2027年实现智算基础设施软硬件全栈自主可控。
政策出台的直接背景是国产 GPU 产业的快速发展与市场需求的激增。根据中商产业研究院数据,2023 年中国 GPU 市场规模达 807 亿元,预计 2025 年将突破 1200 亿元。而北京市作为全国科技创新中心,民营企业在人工智能、自动驾驶、金融科技等领域的算力需求持续增长,政策支持将有效降低企业采购成本,加速国产 GPU 的规模化应用。
国产自主可控 GPU ,买谁家的?
当前,国内已形成涵盖训练、推理、图形渲染的全栈 GPU 产品矩阵,主要厂商及技术突破如下:
- 华为昇腾系列
昇腾 910B 是华为自主研发的 7nm AI 训练芯片,基于达芬奇架构,半精度算力达 320 TFLOPS,支持千亿级参数大模型训练。其配套的 MindSpore 框架与 CANN 异构计算架构,已在智慧城市、交通等领域实现落地,例如与佳都科技合作推出的 “交通行业大模型训推一体机”。昇腾 910B 通过 GpuGeek 等平台实现云端算力资源开放,单卡算力性能对标国际主流产品,且具备全流程国产化生态支持。
- 寒武纪思元系列
寒武纪思元 590 采用 MLUarch05 架构,单卡训练性能超过英伟达 A100,互联集群性能达到 A100 的 80%,部分场景甚至实现反超。该芯片已在百度文心一言等项目中进行测试,预计 2025 年加速出货。寒武纪通过优化基础软件平台,在模型迁移效率上显著提升,例如在 BERT 训练任务中较昇腾 910B 性能提升约 15%。
- 天数智芯
天数智芯的天垓 100 是国内首款 7nm 云端训练通用 GPU,支持千亿级参数大模型混合训练,兼容 PyTorch、TensorFlow 等主流框架,已应用于金融、医疗等领域。其智铠 100 推理芯片则聚焦智慧城市与智能制造,峰值算力达 384TOPS@int8,性价比是市场主流产品的 2-3 倍。通过 DeepSpark 开源社区,天数智芯已汇聚数百个 AI 模型,推动行业应用快速落地。
- 壁仞科技
壁仞科技的 BR104 芯片基于原创 “训推一体” 架构,支持 PCIe 5.0 和 CXL 协议,单卡算力达 300W 以内,已量产并应用于多个行业910。该芯片 BIRENSUPA 软件平台支持大模型训练与推理的无缝切换,适配 OPT、LLaMa 等主流模型。
- 摩尔线程
摩尔线程的 MTT S80 游戏显卡配备 PCIe Gen5 接口与 16GB GDDR6 显存,支持 4K 游戏渲染与 AI 训练推理,已通过中关村在线等平台实现商业化销售。其夸娥万卡智算集群解决方案支持万亿参数大模型训练,MFU(模型利用率)最高达 60%,稳定性达到月级长稳训练标准。
- 沐曦
沐曦的曦思 N100 推理芯片已实现规模量产,单卡 INT8 算力达 160TOPS,支持 8K 视频处理与多模态模型推理,在安防领域完成人脸识别、车牌识别等场景验证。其曦云 C 系列训练芯片则对标英伟达 H100,计划 2025 年推出融合图形渲染的完整 GPU 产品,进一步拓展应用场景。
政策落地与行业影响
预计北京市的支持政策,将从降低采购成本、加速技术迭代等方面推动国产 GPU 产业发展。
按人工智能、云计算、边缘计算等领域企业对GPU的投资额一定比例给予补贴,能够缓解民营企业在算力基础设施上的资金压力。例如,某企业采购价值 1 亿元的昇腾 910B 芯片,若补贴比例为 10%,可直接减少 1000 万元成本。
而政策鼓励企业参与智算中心建设,也能从另一方面为国产 GPU 提供规模化测试场景,给国产芯一个迭代的机会。据悉天数智芯的天垓 100 已经在金融领域的 200 多个应用场景中持续优化,训练效率提升 30%。
但尽管政策利好明确,国产 GPU 产业仍面临多重挑战。
首先在技术差距上,国产芯片在制程工艺(如 2nm 以下)、软件生态(如 CUDA 兼容)等方面与英伟达存在代际差异。例如,沐曦曦思 N100 的 INT8 算力仅为英伟达 A100 的 1/418。
当前,英伟达占据全球 AI 芯片市场 98% 份额,国产厂商需通过差异化竞争突围。而地缘政治带来供应链风险,GPU需要的高端制程依赖台积电等代工厂,需通过中芯国际等本土代工厂寻求替代方案。
- 发文章都不审核的么,数据对不对先不说,句子先搞通顺好不好。
