年初DeepSeek R1的问世,让美国AI圈颤三颤,甚至引发了NVIDIA的股价暴跌。如今,更强的DeepSeek R2也要来了。
据报道,市场最新爆料,R2大模型将采用更先进的混合专家模型(MoE),总参数量较前代R1提升约1倍,预计达1.2万亿(R1总参数量为6710亿),单位推理成本较GPT-4大减97.4%。
当下,中美科技战、贸易战愈演愈烈,NVIDIA H20芯片面临新一波出口管制。
在DeepSeek R2预期发布时间临近的情况下,各界高度关注中国指标性大模型在缺乏美国芯片资源下的发展动向。
据传,R2规模与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当,还将结合更智能的门控网络层(Gating Network),进而优化高负载推理任务的性能。
消息指出,R2将彻底摆脱NVIDIA芯片,训练全程均未使用NVIDIA显卡,全部基于昇腾910B(Ascend 910B)芯片集群平台,在FP16精度下,计算性能达到512 PetaFLOPS,芯片利用率高达82%,整体性能约为NVIDIA上一代A100集群的91%。
市场预期,这有望降低中国对海外高端AI芯片的依赖,且华为全新的昇腾910C芯片也开始进入大规模量产阶段。
成本方面,DeepSeek-R2的单位推理成本较OpenAI旗下的GPT-4大减97.4%。其中,R2输入每百万个字符仅需0.07美元,而输出每百万个字符仅0.27美元。
分析认为,R2若如传闻般强势,可能再次引发市场对AI基础设施需求的质疑,加上华为AI芯片的国产替代,将对NVIDIA带来更大影响。
不过,根据最新报道,市场传出,华为准备测试旗下最新、最强大的AI 芯片昇腾(Ascend)910D,直接对标NVIDIA的高端AI芯片。
消息人士透露,华为已开始接洽部分中国合作伙伴,讨论910D技术可行性的测试事宜。
据悉,华为最快5月就能取得910D首批样本。当然, 一切尚在初期阶段,之后仍需要一系列测试来评估处理器性能,为供应客户做好准备。
华为期望,最新一代昇腾AI处理器的性能能超越NVIDIA 2022年发布的热门AI训练芯片H100。
4月早些时候,美国将特供中国市场的H20芯片加入出口管制名单,NVIDIA也因此认列55亿美元费用。
这也让NVIDIA的中国竞争对手(诸如华为、寒武纪)有了更多国产替代的机会。
预计,今年华为昇腾910B及910C的出货量将超过800,000颗,客户包括中国电信运营商和民营AI开发商(例如TikTok母公司字节跳动)。美国出手管制H20出口后,部分买家已开始跟华为商谈要加码下订910C。
今年3月20日,NVIDIA CEO黄仁勋接受采访时公开点赞华为,并直言“华为是中国最强大的科技公司,征服了他们涉足的每一个市场。”
黄仁勋表示,美国主导限制中国科技巨头的努力“搞得很糟糕”。据悉,NVIDIA已连续两年将华为列入竞争对手名单。