闭环!DeepSeek-R2与华为深度合体,昇腾芯片利用率达82%;推理成本较GPT-4下降了97.4%!

原创 飙叔科技洞察 2025-04-28 18:10
当特朗普4月中旬宣布将对英伟达专供中国市场的的H20其他同类产品要进行出口许可申请的时候(实际就是断供,详见:断供中国!英伟达损失55亿美元?远超于此!),黄仁勋不顾美国国内的政治风险,在特朗普宣布“断供”之后,火急火燎直奔北京;除了见到不少高层之外,还特意与DeepSeek创始人梁文锋见面商谈“针对中国客户的新芯片设计”
而DeepSeek最新消息也接踵而至,根据数码大V——deedydas透露,DeepSeek-R2即将发布,这与之前市场预计的5月发布不谋而合。
同时,还提前爆料了DeepSeek-R2的最新参数情况:DeepSeek-R2的模型总参数量预计将达到1.2万亿,较之DeepSeek-R1(6710亿参数)提升约1倍。也就是说,从参数规模来看,DeepSeek-R2已与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当
另外,与R1类似推理性能依然是DeepSeek的最强“杀手锏”。据了解DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),结合了更加智能的门控网络层(Gating Network),进一步优化高负载推理任务的性能;预计单单推理性能来看,DeepSeek-R2将秒杀一众主流大模型
当然,相信大家最关心的还是此次DeepSeek-R2用的训练芯片是哪家的。综合各方渠道来看,此次DeepSeek-R2的训练芯片应该是使用了多家的AI芯片,但毫无疑问华为昇腾910系列芯片在其中发挥了重要作用
据说,DeepSeek-R2实现了基于华为昇腾910B(Ascend 910B)芯片集群平台的训练方案,在FP16精度下实现了512PetaFLOPS的计算性能,芯片资源利用率达到82%。根据华为实验室的数据,这一算力大约是英伟达上一代A100训练集群的91%而近期关于昇腾910C即将于5月份量产,甚至昇腾920也将于下半年推出的消息汹涌而来(详见:华为AI芯片910C将于5月量产出货,920也在路上了!),这意味着华为昇腾系列芯片事实上已经成为国产AI产业的硬件底座。
这使得DeepSeek-R2的推理成本进一步下降,据说DeepSeek-R2的单位推理成本较之GPT-4下降了97.4%,DeepSeek-R2的成本约为0.07美元/百万token,而GPT-4则高达0.27美元/百万token。也就是说,凭借超低成本以及超强推理性能而出圈的DeepSeek-R1之后,R2必将给全球AI大模型以及AI应用带来更大的冲击
首当其冲的就是国产服务器及相关的云服务厂商将从中受益,具体来说,拓维信息、中科曙光、新易盛等近期都将迎来一波超级大利好!
但飙叔认为,DeepSeek的异军突起最大的受益方将是——国产AI芯片,众所周知今年1月,DeepSeek的突然崛起之后中国市场对低成本人工智能模型的需求激增,本来英伟达凭借着CUDA生态,其H20芯片可能成为最大的赢家;但美国“断供”之后给国产推理芯片留下了巨大的市场空间,比如寒武纪、燧原科技、天数智芯、摩尔线程、壁仞科技等国产AI芯片厂商,这些厂商不仅都已接入了DeepSeek,更为关键的是有机会获得了验证和实战应用的机会,为进一步性能的优化提供了巨大的“试错”空间。
因此,实际上DeepSeek的异军突起,绝不仅仅是国产大模型进步的标志,更重要的是DeepSeek大模型与昇腾平台的深度融合,为国产AI产业提供了“算法+芯片”一站式解决方案也意味着国产AI生态正在形成闭环,甚至未来将形成国产AI技术标准。

飙叔科技洞察 一起关注国产光刻机、国产芯片、国产半导体艰难突破之路;一起分享华为海思、华为鸿蒙等华为产业点点滴滴!
评论
  •   作战仿真推演系统:军事训练与决策的核心驱动力   作战仿真推演系统作为现代军事的关键工具,通过虚拟战场构建实现战术至战略全维度覆盖,以数字化手段提升训练效能、辅助科学决策。以下从功能、架构、应用与趋势四方面展开分析:   应用案例   目前,已有多个作战仿真推演系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润作战仿真推演系统。这些成功案例为作战仿真推演系统的推广和应用提供了有力支持。   一、系统功能:全层级作战模拟   战术级训练   系统可模拟单兵到营级作战行
    华盛恒辉l58ll334744 2025-05-20 10:30 71浏览
  • 电磁场是自然界中一种特殊的物质存在形式,由相互依存且能够相互转化的电场和磁场共同构成。这种无形的物理场充满整个空间,既能够传递电磁力,也能够以电磁波的形式传播能量。电场源于静止或运动的电荷,表现为对带电粒子施加作用力的能力;而磁场则产生于电流或变化的电场,能够影响运动电荷的轨迹。两者通过动态耦合形成统一的电磁场系统,其行为规律由麦克斯韦方程组完整描述。这个方程组包含四个基本方程,分别揭示了电荷如何产生电场、磁场无孤立磁荷的特性、变化磁场激发电场的规律,以及电流与变化电场共同产生磁场的机制。电磁场
    锦正茂科技 2025-05-19 13:07 54浏览
  • 电磁场的作用主要体现在以下几个方面:首先在能源领域,电磁场是发电、输电的基础。无论是火力发电还是核电站,*终都需要通过电磁感应原理将机械能转化为电能。高压输电线路则利用交变电磁场实现电能的远距离传输,为现代工业和生活提供动力保障。在通信技术方面,电磁波作为电磁场的传播形式,构成了无线通信的基础。从无线电广播到5G移动网络,从卫星通信到光纤传输,本质上都是对特定频段电磁场的**控制和利用。雷达系统通过发射和接收电磁波实现目标探测,在气象预报、航空管制等领域不可huo缺。在医疗领域,电磁场技术为诊断
    锦正茂科技 2025-05-19 13:19 59浏览
  • 北京贞光科技作为三星电机一级代理商,提供全面升级的技术支持、样品供应和供应链保障服务,为客户提供专业、可靠的一站式解决方案,满足AI基础设施不断发展的需求,支持更高效、更强大的人工智能应用计算系统的开发。如需更多产品信息或技术支持,请联系贞光科技。三星电子在被动元件技术领域取得重大突破,推出专为AI服务器应用设计的超小型高容量多层陶瓷电容器(MLCC)。这些新组件解决了现代AI计算基础设施不断增长的电力需求,同时优化了密集服务器环境中的空间利用率。 满足AI服务器电力需求现代AI服务器
    贞光科技 2025-05-20 11:38 54浏览
  • 在智能化、数字化与信息化的时代浪潮下,物联网凭借着多频段间的通信协同能力与多协议间的通信兼容能力构建起了一张张无缝互通的IoT设备网络。从Sub-GHz频段到2.4GHz频段,从BLE/Wi-Fi协议到LoRa/Wi-SUN协议,多种频段资源与通信协议不仅推动了智能抄表、智能家居与工业自动化等领域的繁荣发展,还为万物互联的未来愿景奠定了坚实的底层通信基础。然而,随着无线通信技术的高速发展与全球IoT设备数量的持续增长,频段资源的有限性愈发凸显,在科技园区、交通枢纽与CBD等通信密集区域,同一频段
    华普微HOPERF 2025-05-20 11:07 44浏览
  •   北京作为全国科技创新核心,汇聚众多实力强劲的软件开发企业。它们凭借深厚技术积淀与丰富行业经验,为金融、教育、医疗、零售等领域提供多元数字化方案。以下梳理北京地区代表性企业,为企业选型提供参考。   华盛恒辉科技有限公司:是一家专注于高端软件定制开发服务和高端建设的服务机构,致力于为企业提供全面、系统的开发制作方案。在部队政企开发、建设到运营推广领域拥有丰富经验,在教育,工业,医疗,APP,管理,商城,人工智能,部队软件、工业软件、数字化转型、新能源软件、光伏软件、汽车软件,ERP,系统二次
    华盛恒辉l58ll334744 2025-05-20 11:00 67浏览
  •   头部技术企业核心能力与行业解决方案解析   华盛恒辉科技有限公司   华盛恒辉科技有限公司:是一家专注于高端软件定制开发服务和高端建设的服务机构,致力于为企业提供全面、系统的开发制作方案。在部队政企开发、建设到运营推广领域拥有丰富经验,在教育,工业,医疗,APP,管理,商城,人工智能,部队软件、工业软件、数字化转型、新能源软件、光伏软件、汽车软件,ERP,系统二次开发,CRM等领域有很多成功案例。   五木恒润科技有限公司   五木恒润科技有限公司:是一家专业的部队信息化建设服务单位
    华盛恒辉l58ll334744 2025-05-19 17:18 98浏览
  • 随着智能硬件设备的快速发展,蓝牙音频语音芯片在智能家居、穿戴设备、车载电子等领域得到广泛应用。蓝牙音频语音芯片凭借其低功耗、高集成度和灵活的通信接口,成为许多开发者的选择。然而,在实际应用中,开发者可能会遇到IC芯片通过串口或MCU通信时无响应的问题。本文将从通信接口配置与故障排查角度,普及相关知识并提供解决方案。一、通信接口基础配置串口接线规则蓝牙芯片的串口通信需遵循“交叉连接”原则:TX(发送端)→ RX(接收端)RX(接收端)→ TX(发送端)若接线错误(如TX-TX或RX-RX直连),数
    广州唯创电子 2025-05-19 09:47 31浏览
  •   
    华盛恒辉l58ll334744 2025-05-20 11:41 53浏览
  • 什么是互斥量互斥量的应用场合互斥量的API函数基本代码结构互斥量使用举例递归锁递归锁举例总结什么是互斥量在freeRTOS中,多个任务访问一块共享资源,会产生竞争现象。比如马路上只有一个很早以前的电话亭,A、B都想要打电话,然后他们就开始打架了。但是如果A先进去了然后把门锁了,B想进去打电话的话只能在外面等,必须等到A把门锁打开。互斥量的应用场合像freeRTOS的多任务系统,任务A正在使用某个资源,还没用完的时候,任务B也来使用,就可能会导致问题。就比如串口,任务A正在用串口发送数据,此时任务
    二月半 2025-05-18 20:54 104浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦