DeepSeek也毫无悬念地干到了全球增速最快的AI应用。这几天,国内的云计算厂家都在支持DeepSeek的API调用。
现在,国家队也出手了!超算互联网的官微一口气发了两条上新DeepSeek的公告——DeepSeek-R1、V3、Coder 等系列模型已陆续在国家超算互联网平台上线。目前,国家超算互联网平台已推出 DeepSeek – R1 模型的 1.5B、7B、8B、14B 版本,后续还会在近期更新 32B、70B 等版本。
地址:https://www.scnet.cn/ui/mall/
小编体验了一下超算互联网平台,超算平台接入这事真的是个福音:免注册的模式势必大幅度降低用AI的门槛,让所有人都能感受一把AI推理的魅力!
从首页点进去就来到了对话界面,不用下载,也不用注册,真正的0门槛使用。
推理的效果如下,作为一个7B的小模型,效果还是相当惊艳的。内容输出略有卡顿,但是在可以接受的范围里~
可能有些人和小编一样,对国家超算互联网平台感觉有些陌生。
但稍微了解下就知道这次支持的分量:国家超算互联网平台是一个由科技部指导发起的国家级平台。
这个平台就像是算力的“南水北调”:整合全国的超算资源,通过互联网的思维运营超算中心,连接算力供给、应用开发、运营服务和用户等各方资源,构建一体化的超算算力网络和服务平台。
不只是利好想尝鲜DeepSeek的普通用户,其实超算平台想做的是打通企业部署大模型的最后几公里。
对于有私有化部署需求,需引入专有数据进行DeepSeek模型训练的用户和企业,超算互联网平台同样提供了可靠的解决方案。
二、平台纷纷官宣接入, DeepSeek全面开花
无论是云平台还是国产GPU,大家都在接DeepSeek带来的泼天富贵。从2月起,DeepSeek的支持官宣一直不断!
顺便说一句,大家应该注意到了上文互联网超算中心支持的是 DeepSeek基于通义千问模型的蒸馏模型。与全尺寸 DeepSeek 模型相比,较小尺寸的 DeepSeek 蒸馏版本模型更适合企业内部实施部署,可以极大地降低落地成本,目前本地部署也都是这个方案。而一众云厂商提供的API,则一般是满血版的DeepSeek-R1。
腾讯云:2月2日,腾讯云宣布DeepSeek-R1大模型已一键部署至其“HAI”平台,开发者仅需3分钟即可接入调用。该平台省去了购买显卡、安装驱动、配置网络等繁琐步骤。
百度智能云:2月3日晚间,百度智能云宣布其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低价格方案及限时免费服务。用户登录千帆ModelBuilder即可快速体验。
阿里云:2月3日,阿里云宣布其PAI Model Gallery支持云上一键部署DeepSeek-V3和DeepSeek-R1模型。用户可在该平台上零代码实现从训练到部署再到推理的全过程。
沐曦:2月2日,沐曦联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型,首批上线的四个较小规模的模型(1.5B、7B、14B、32B)均部署在国产沐曦曦云GPU上。
天数智芯:2月4日,天数智芯宣布与Gitee AI合作,仅用时一天就完成了与DeepSeek-R1模型的适配工作,并已上线多个大模型服务,包括1.5B、7B、14B等版本。
摩尔线程:2月4日,摩尔线程宣布已实现对DeepSeek蒸馏模型推理服务的部署,并即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。
写在最后
1、C++训练营,来了!
2、HarmonyOS 学习资料分享(无套路免费分享)
我组建了一些社群一起交流,群里有大牛也有小白,如果你有意可以一起进群交流。
欢迎你添加我的微信,我拉你进技术交流群。此外,我也会经常在微信上分享一些计算机学习经验以及工作体验,还有一些内推机会。
加个微信,打开另一扇窗
感谢你的分享,点赞,在看三连