DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,普通PC可跑

OpenCV学堂 2025-03-25 22:44




【导读】685B的DeepSeek-V3新版本,就在昨夜悄悄上线了。参数量685B的V3,代码数学推理再次显著提升,甚至代码追平Claude 3.7,网友们实测后大呼强到离谱!有人预测说,按照此前的节奏,DeepSeek-R2大概率几周内就将上线。

昨晚,DeepSeek-V3悄然升级!

新模型版本为DeepSeek-V3-0324,参数量为6850亿,相较上个版本参数增幅不大(6710亿)。

从发布时间和技术特点来看,DeepSeek-V3-0324,很可能是DeepSeek-R2的基础架构。

所以按照DeepSeek一贯的产品发布节奏(先推出基础模型,几周后再发布专门的推理增强版)来看,DeepSeek-R2很可能在几周后就将上线!

升级后的V3在代码、数学推理能力上,得到显著提升。尤其是代码领域,不少网友直呼「眼前一亮」。

相较于上一版,从一个球在超立方体弹跳的Python脚本,即可看出V3代码性能的改善。

甚至,它还能解锁Claude 3.7 Sonnet很多玩法,代码可以与之正面较量。

值得一提的是,DeepSeek V3另一大亮点在于采用MIT开源协议,上个版本还是自定义许可证。

这不仅可以自由修改、分发模型,还支持模型蒸馏、商业化应用。

模型文件总计641GB,主要以model-00035-of-000163.safetensors形式存在

685B虽大,但也能在消费级设备上跑起来。

这不,苹果机器学习工程师Awni Hannun就基于MLX框架和4-bit量化,在512GB M3 Ultra实现了超过20 token/s的运行速度。

这种量化方式直接将模型的磁盘占用空间减少到352GB。

有M3 Ultra的童鞋们,可以按照下面的方式使用llm-mlx跑起来:

llm mlx download-model mlx-community/DeepSeek-V3-0324-4bitllm chat -m mlx-community/DeepSeek-V3-0324-4bit
若是本地跑不了的朋友,除了官网之外,还可以在OpenRouter上体验。

体验地址:openrouter.ai/chat?models=deepseek/deepseek-chat-v3-0324:free

相比起某些会在发布前数月就开始大肆宣传造势的O和A开头的AI公司,DeepSeek这种低调办大事的风格可谓是天壤之别。

没有白皮书,没有博客文章,只有一个空白的README文件和模型权重本身——上线即可直接可以下载使用。

新版V3代码能力飙升,追平Claude 3.7

遗憾的是,DeepSeek尚未公布新版模型的系统卡,暂时无法窥探更多技术细节。

官方小助手的更新提示

不过,这并未阻挡全网对新模型的热情,已有机构、网友纷纷对V3展开通用能力、代码、数学等多维度的测评。

根据网友Xeophon的自测,DeepSeek-V3-0324所有指标性能暴涨,击败了Claude 3.5 Sonnet,成为目前最强的非推理模型。

就代码能力来看,DeepSeek-V3-0324同样能够与Claude 3.5 Sonnet一决高下。

另外,在Aider的多语言基准测试中,DeepSeek-V3-0324拿下55%成绩,较前代版本显著提升,成为仅次于Sonnet 3.7的非推理类模型第二名。

其表现已可媲美R1和o3-mini等具备推理能力的模型。

网友「karminski-牙医」还带来了全网最速的代码实测,新模型直接干翻了DeepSeek R1,与Claude 3.7相匹敌。

在 KCORES大模型竞技场中,Claude-3.7-Sonnet-Thinking无疑是LLM当之无愧的王者,DeepSeek-V3-0324以328.3分拿下第三名,仅次于Claude 3.5 Sonnet。

他还展开了四项评测,20个小球碰撞测试,上个版本结果挤成一团,DeepSeek-V3-0324在物理模拟上表现更好。



在mandelbrot-set-meet-libai测试中,DeepSeek-V3-0324没有过多变化,较初版仅仅低了2分,完成度提升很高。


还有火星任务测试中,DeepSeek-V3-0324星球渲染正确,所有模型中位列第三。


九大行星测试,DeepSeek-V3-0324真正绘制出了太阳系的完整图。


此外,DeepSeek-V3-0324在Misguided Attention基准上,跃居非推理类模型榜首,甚至超越了Claude Sonnet 3.7(非推理模型)。

令人惊讶的是,它现在能解决一些此前只有推理模型才能处理的提示,比如「4升水壶问题」。

V3-0324似乎学会了识别推理循环,并跳出循环——这种能力甚至是许多专业推理模型都不具备的。

颜色越深代表特定提示的正确响应次数越多

接下来,看看DeepSeek-V3-0324在多项实测中的具体表现如何。

网友实测,一个提示即出网页

网友「Deepanshu Sharma」表示,更新后的DeepSeek-V3-0324简直「强的过分了」。

他用这个新模型一气呵成创建了一个新网站,编写了800多行代码,一次都没有出错!

「看到这些厉害的开源模型不断给大公司施加压力,迫使他们以低成本构建更好的模型,真是太棒了!」Deepanshu写道。

网友「Risphere」体验完新的DeepSeek-V3-0324后表示,其在编码方面已经与Claude 3.7 Sonnet处于同一水平上了。

要知道,Claude模型一直以来都是公认的代码能力最强的模型。

不仅如此,Risphere甚至认为DeepSeek-V3-0324在前端开发方面超越了o1-pro和GPT-4.5!

要知道,o1-pro可是需要付费200美元每月的ChatGPT Pro会员才可以体验的模型。

Petri Kuittinen体验完DeepSeek-V3-0324后认为,「Anthropic和OpenAI遇上麻烦了!」。

他使用了一段非常简短的提示词就制作出了一个精美的响应式网页,提示词如下:

Create a great-looking responsive front page for AI company. Include everything in one HTML5 file. 
为AI公司创建一个看起来很棒的响应式首页。将所有内容包含在一个HTML5文件中。

Petri认为,DeepSeek-V3-0324是在前端编程上也优于DeepSeek-R1。

他完成的这个网站共有958行代码,包括所有图像,而且也适合手机上观看。



 
 
 
 
左右滑动查看

不只是编程问题,数学竞赛也难不倒它。

数学博士、奥赛金牌得主Jasper用AIME 2025中的题目测试了一下DeepSeek-V3-0324,它顺利解决了。

Jasper表示,他现在对开源AI模型最终获胜更有信心了!

编码智能体Cline的速度很快,第一时间更新了DeepSeek-V3-0324。

他们还给出了使用的理由,DeepSeek-V3-0324在编码任务上性能与Claude 3.7 Sonnet不相上下,价格却低了53倍。

不止如此,Cline还表示,DeepSeek-V3-0324较之前的版本增加了60%的专家(从160增加到256),使用了FP8精度训练将计算效率翻倍,不仅使前端编码能力增强,数学与逻辑能力也有所提升。

DeepSeek注定改变全球AI格局

这次DeepSeek-V3的突然上线,节奏也与过去他们在圣诞节期间发布V3、几周后推出R1的模式完全吻合。

本来,业界就一直传闻R2将在4月亮相,V3的上线基本吹响了R2的前奏。

先进开源推理模型的影响,已经不必多说了。如果它们能免费提供,那原本只有财力雄厚的大型机构才能获得的高级AI系统,会变得人人可用。

而如果DeepSeek-R2能延续R1的发展路线,但它很可能会直接单挑OpenAI捂着的大炸弹GPT-5。这就让OpenAI靠封闭生态和雄厚资金支持带来的垄断,被彻底打破。

当OpenAI和Anthropic还在为模型设置付费访问限制时,DeepSeek已经实现了封闭模型无法达到的爆发式创新。

而中美AI差异,已经日渐缩小,全球AI格局已被重塑。几个月前,大部分分析师估计,中国在AI能力上落后美国1-2年,今天这一差距已经缩小至3-6个月,甚至呈现中国领先的趋势。

而开源的方式,甚至还解决了中国公司的特殊挑战(受限于英伟达先进芯片),因为更注重在算力有限的情况下达到有竞争力的性能,现在这已成为中国企业的潜在优势。

就像Android系统一样,凭着广泛的普及性和数千开发者的集体创新,DeepSeek很可能最终超越封闭系统。

谁将通过AI拥有对世界最大的影响力?让我们拭目以待。

参考资料:HNYZ
https://venturebeat.com/ai/deepseek-v3-now-runs-at-20-tokens-per-second-on-mac-studio-and-thats-a-nightmare-for-openai/
https://x.com/TheXeophon/status/1904225899957936314
https://x.com/cline/status/1904275590678786545
https://x.com/karminski3/status/1904212084306653648


OpenCV4系统化学习

图片

推荐阅读

OpenCV4.8+YOLOv8对象检测C++推理演示

ZXING+OpenCV打造开源条码检测应用

攻略 | 学习深度学习只需要三个月的好方法

三行代码实现 TensorRT8.6 C++ 深度学习模型部署

实战 | YOLOv8+OpenCV 实现DM码定位检测与解析

对象检测边界框损失 – 从IOU到ProbIOU

初学者必看 | 学习深度学习的五个误区



图片

OpenCV学堂 专注计算机视觉开发技术分享,技术框架使用,包括OpenCV,Tensorflow,Pytorch教程与案例,相关算法详解,最新CV方向论文,硬核代码干货与代码案例详解!作者在CV工程化方面深度耕耘15年,感谢您的关注!
评论
  •   无人机蜂群电磁作战仿真系统软件,是专门用于模拟、验证无人机蜂群在电磁作战环境中协同、干扰、通信以及对抗等能力的工具。下面从功能需求、技术架构、典型功能模块、发展趋势及应用场景等方面展开介绍:   应用案例   目前,已有多个无人机蜂群电磁作战仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机蜂群电磁作战仿真系统。这些成功案例为无人机蜂群电磁作战仿真系统的推广和应用提供了有力支持。   功能需求   电磁环境建模:模拟构建复杂多样的电磁环境,涵盖各类电磁干扰源与
    华盛恒辉l58ll334744 2025-04-17 16:49 148浏览
  • 【摘要/前言】4月春日花正好,Electronica就在浪漫春日里,盛大启幕。2025年4月15-17日,慕尼黑上海电子展于上海新国际博览中心成功举办。伴随着AI、新能源汽车、半导体的热潮,今年的Electronica盛况空前。请跟随Samtec的视角,感受精彩时刻!【 Samtec展台:老虎的朋友圈技术派对】借天时、占地利、聚人和,Samtec 展台人气爆棚!每年展会与大家相聚,总能收获温暖与动力~Samtec展台位于W3展馆716展位,新老朋友相聚于此,俨然一场线下技术派对!前沿D
    电子资讯报 2025-04-17 11:38 62浏览
  • 现阶段,Zigbee、Z-Wave、Thread、Wi-Fi与蓝牙等多种通信协议在智能家居行业中已得到广泛应用,但协议间互不兼容的通信问题仍在凸显。由于各协议自成体系、彼此割据,智能家居市场被迫催生出大量桥接器、集线器及兼容性软件以在不同生态的设备间构建通信桥梁,而这种现象不仅增加了智能家居厂商的研发成本与时间投入,还严重削减了终端用户的使用体验。为应对智能家居的生态割裂现象,家居厂商需为不同通信协议重复开发适配方案,而消费者则需面对设备入网流程繁琐、跨品牌功能阉割及兼容隐患等现实困境。在此背景
    华普微HOPERF 2025-04-17 17:53 121浏览
  • 一、行业背景与需求随着智能化技术的快速发展和用户对便捷性需求的提升,电动车行业正经历从传统机械控制向智能交互的转型。传统电动车依赖物理钥匙、遥控器和独立防盗装置,存在操作繁琐、功能单一、交互性差等问题。用户期待通过手机等智能终端实现远程控制、实时数据监控及个性化交互体验。为此,将蓝牙语音芯片集成至电动车中控系统,成为推动智能化升级的关键技术路径。二、方案概述本方案通过在电动车中控系统中集成WT2605C蓝牙语音芯片,构建一套低成本、高兼容性的智能交互平台,实现以下核心功能:手机互联控制:支持蓝牙
    广州唯创电子 2025-04-18 08:33 203浏览
  • 近日,全球6G技术与产业生态大会(简称“全球6G技术大会”)在南京召开。紫光展锐应邀出席“空天地一体化与数字低空”平行论坛,并从6G通信、感知、定位等多方面分享了紫光展锐在6G前沿科技领域的创新理念及在空天地一体化技术方面的研发探索情况。全球6G技术大会是6G领域覆盖广泛、内容全面的国际会议。今年大会以“共筑创新 同享未来”为主题,聚焦6G愿景与关键技术、安全可信、绿色可持续发展等前沿主题,汇聚国内外24家企业、百余名国际知名高校与科研代表共同商讨如何推动全行业6G标准共识形成。6G迈入关键期,
    紫光展锐 2025-04-17 18:55 202浏览
  •   无人机电磁兼容模拟训练系统软件:全方位剖析   一、系统概述   北京华盛恒辉无人机电磁兼容模拟训练系统软件,专为满足无人机于复杂电磁环境下的运行需求而打造,是一款专业训练工具。其核心功能是模拟无人机在电磁干扰(EMI)与电磁敏感度(EMS)环境里的运行状况,助力用户评估无人机电磁兼容性能,增强其在复杂电磁场景中的适应水平。   应用案例   目前,已有多个无人机电磁兼容模拟训练系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁兼容模拟训练系统。这些成功案例为
    华盛恒辉l58ll334744 2025-04-17 14:52 65浏览
  •   无人机电磁环境效应仿真系统:深度剖析   一、系统概述   无人机电磁环境效应仿真系统,专为无人机在复杂电磁环境下的性能评估及抗干扰能力训练打造。借助高精度仿真技术,它模拟无人机在各类电磁干扰场景中的运行状态,为研发、测试与训练工作提供有力支撑。   应用案例   目前,已有多个无人机电磁环境效应仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁环境效应仿真系统。这些成功案例为无人机电磁环境效应仿真系统的推广和应用提供了有力支持。   二、系统功能  
    华盛恒辉l58ll334744 2025-04-17 15:51 150浏览
  • 置信区间反映的是“样本均值”这个统计量的不确定性,因此使用的是标准误(standard error),而不是直接用样本标准差(standard deviation)。标准误体现的是均值的波动程度,而样本标准差体现的是个体数据的波动程度,两者并非一回事,就如下图所显示的一样。下面优思学院会一步一步解释清楚:一、标准差和标准误,究竟差在哪?很多同学对“标准差”和“标准误”这两个概念傻傻分不清楚,但其实差别明显:标准差(Standard Deviation,σ或s):是衡量单个数据点相对于平均值波动的
    优思学院 2025-04-17 13:59 37浏览
  •   北京华盛恒辉无人机电磁兼容模拟训练系统软件是专门用于模拟与分析无人机在复杂电磁环境中电磁兼容性(EMC)表现的软件工具。借助仿真技术,它能帮助用户评估无人机在电磁干扰下的性能,优化电磁兼容设计,保障无人机在复杂电磁环境中稳定运行。   应用案例   目前,已有多个无人机电磁兼容模拟训练系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁兼容模拟训练系统。这些成功案例为无人机电磁兼容模拟训练系统的推广和应用提供了有力支持。   系统功能   电磁环境建模:支持三维
    华盛恒辉l58ll334744 2025-04-17 15:10 110浏览
  • 一、行业背景与需求智能门锁作为智能家居的核心入口,正从单一安防工具向多场景交互终端演进。随着消费者对便捷性、安全性需求的提升,行业竞争已从基础功能转向成本优化与智能化整合。传统门锁后板方案依赖多颗独立芯片(如MCU、电机驱动、通信模块、语音模块等),导致硬件复杂、功耗高、开发周期长,且成本压力显著。如何通过高集成度方案降低成本、提升功能扩展性,成为厂商破局关键。WTVXXX-32N语音芯片通过“单芯片多任务”设计,将语音播报、电机驱动、通信协议解析、传感器检测等功能整合于一体,为智能门锁后板提供
    广州唯创电子 2025-04-18 09:04 192浏览
  •   无人机蜂群电磁作战仿真系统全解析   一、系统概述   无人机蜂群电磁作战仿真系统是专业的仿真平台,用于模拟无人机蜂群在复杂电磁环境中的作战行为与性能。它构建虚拟电磁环境,模拟无人机蜂群执行任务时可能遇到的电磁干扰与攻击,评估作战效能和抗干扰能力,为其设计、优化及实战应用提供科学依据。   应用案例   目前,已有多个无人机蜂群电磁作战仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机蜂群电磁作战仿真系统。这些成功案例为无人机蜂群电磁作战仿真系统的推广和应用提
    华盛恒辉l58ll334744 2025-04-17 16:29 168浏览
  •     爬电距离指的是两个带电体之间、带电体和大地之间,沿着绝缘材料表面的最短距离。与爬电距离有关的标准有IEC 61010-1。PCB设计方面,可以参照IPC-2221B。        (图源TI)    任何情况下,爬电距离不允许小于电气间隙。当绝缘材料是空气时,爬电距离可以和电气间隙相等。电气间隙的简介见协议标准第011篇。        一般情况下
    电子知识打边炉 2025-04-19 20:54 51浏览
  •     CTI是Comparative Tracking Indices的缩写,在GB 4207中被译作“比较追踪指数”,我认为还是“漏电起痕指数”更容易理解。    CTI表述了材料的绝缘特性——阻止不希望出现的电流。CTI的单位是V,在绝缘物表面添加一定量的电解液并施加电场,观察在绝缘物表面既不会持续产生火焰,也不会因为热、介质击穿、湿气或者污染物产生电弧放电留下痕迹(起痕)的最高电压。CTI的测量方法见IEC 60112 (GB 4207)。&nbs
    电子知识打边炉 2025-04-19 21:20 57浏览
  • 1. 在Ubuntu官网下载Ubuntu server  20.04版本https://releases.ubuntu.com/20.04.6/2. 在vmware下安装Ubuntu3. 改Ubuntu静态IP$ sudo vi /etc/netplan/00-installer-config.yaml# This is the network config written by 'subiquity'network:  renderer: networkd&nbs
    二月半 2025-04-17 16:27 162浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦