产业丨DeepSeek的压力给到华尔街,掀起蝴蝶效应

AI芯天下 2025-02-06 20:30

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言
传统AI训练对算力的需求巨大,而英伟达的芯片作为算力的核心,其重要性不言而喻。

然而,DeepSeek的问世使市场认识到,AI对算力的需求并非如先前所预期的那样庞大。



作者 | 方文三
图片来源 |  网 络 


DeepSeek打开大模型新思路


20241月20日,DeepSeek公司正式发布了其推理模型DeepSeek-R1的完整版本。


该模型以较低的训练成本实现了与OpenAI推理模型o1相媲美的性能,并且完全免费开源,这一举措在业界引起了巨大反响。


众多开发者表示,他们正在考虑利用DeepSeek技术对现有系统进行彻底的重构。


在这一趋势的推动下,DeepSeek推出的移动端应用在一周内迅速发酵,并在发布仅一个月后,跃升至美区苹果应用商店免费应用排行榜首位,不仅超越了ChatGPT,也超越了其他热门应用。


2025年1月28日,DeepSeek进一步开源了其多模态模型Janus-Pro-7B,并宣称在GenEval和DPG-Bench基准测试中胜过了DALL-E 3(由OpenAI开发)和Stable Diffusion。


在本次DeepSeek Janus Pro与DALL-E 3的对比分析中,DALL-E 3的参数量先前公布为120亿,而Janus Pro的大模型参数量仅为70亿。


R1的问世不仅打破了科技巨头独占推动旗舰开源模型的传统行业共识,还颠覆了去年形成的另一个行业共识,即通用大型模型正逐渐演变成大型企业间资本竞争的领域。



硬件媒体Tom's Hardware发布了开年最受关注的报道:DeepSeek甚至绕过了CUDA,转而使用更为基础的编程语言进行优化。


DeepSeek R1与OpenAI o1在技术上的关键区别在于其创新的训练方法,例如在数据训练阶段采用的R1-Zero方法,直接将强化学习(RL)应用于基础模型,而无需依赖监督微调(SFT)和已标注数据。


根据DeepSeek官方技术文档,R1模型利用数据蒸馏技术(Distillation)生成的高质量数据,提升了训练效率。


数据蒸馏是指通过一系列算法和策略,对原始、复杂的数据进行去噪、降维、提炼等处理,从而得到更为精炼、有用的数据。


这也是DeepSeek能够以更少的参数量实现与OpenAI o1模型性能相当的关键所在。


DeepSeek并非传统意义上的科技企业,却以远低于美国大型模型公司所使用的GPU资源和成本,成功研发出极具创新性的模型。


其R1模型的训练成本仅为560万美元,这一数额甚至不及Meta GenAI团队中任何一位高层管理人员的年薪。



背后幻方量化的投资布局考量


梁文锋,作为两家资产规模达百亿的量化私募机构——浙江九章资产管理有限公司和宁波幻方量化投资管理合伙企业(有限合伙)的实际控制人,同时也是DeepSeek的创始人。


梁文锋自浙江大学电子工程系AI专业毕业后,曾涉足与专业不直接相关的金融科技行业,专注于私募基金和量化投资领域多年。


作为量化投资领域的资深私募公司,幻方量化自2015年成立以来迅速崛起,成为行业的领头羊,管理规模一度突破千亿人民币。


作为私募公司,幻方量化必须通过量化投资业务实现盈利,以保障公司的持续运营和发展,包括为DeepSeek的研发提供资金支持。


在量化投资领域,公司运用先进的量化策略,结合AI技术对大量金融数据进行分析和建模,制定精确的投资决策,在过去的市场表现中取得了显著的业绩。


在2016年,幻方量化推出了首个基于深度学习的交易模型,并开始将GPU引入计算交易仓位。


此后,梁文峰不断扩大AI算法研究团队,将AI技术深度融入金融投资量化策略中,逐步取代了所有传统模型。


至2017年,幻方宣布其投资策略已全面AI化。


至2019年,幻方量化成为中国首家募资超过1000亿元人民币的量化基金。


幻方量化自2019年起开始囤积GPU,至2021年,在中国拥有1万张GPU的企业寥寥无几,而拥有1万张英伟达A100芯片的公司仅幻方量化一家。


随着幻方量化囤积GPU规模的不断扩大,幻方开始成立专门的AI研究公司。


2019年推出萤火一号AI集群,2021年又投资10亿人民币,研发萤火二号以提供算力支持,可见在技术层面,幻方量化把握住了市场机遇。


在美国于2022年对中共实施芯片制裁之前,幻方量化已大规模购买英伟达芯片,为后续产品的面世奠定了重要基础。


2023年7月,梁文峰宣布正式进军通用AIAPI领域,创办了DeepSeek,仅用10个月时间,至2024年5月,DeepSeek推出了version2模型。


DeepSeek的成立标志着幻方量化从量化投资向AI技术的深度转型。


通过DeepSeek,梁文锋不仅在AI领域取得了显著成就,还为幻方量化在量化投资领域提供了更强大的技术支持。


作为国内领先的量化投资机构,幻方量化自成立以来,一直致力于运用机器学习和全自动量化交易推动国内量化投资的发展。


随着AI大模型在国内的迅速崛起,业界流传着一种说法:在中国,拥有最多高性能GPU的机构并非AI公司,而是幻方量化。


资金雄厚、不吝啬的幻方量化在背后支持DeepSeek进行模型研究,其研究路线坚持开放源代码,且并不急于将研究成果商业化应用。


据接近DeepSeek管理层的内部人士介绍,梁文锋已个人投资于一些未来可能在DeepSeek模型基础上发展起来的下游AI应用企业项目。


这表明梁文锋正在为DeepSeek未来构建一个小型生态系统而提前进行布局。



对英伟达等科技巨头的潜在影响


美国财经杂志《财富》发出警告,指出DeepSeek正对英伟达在AI领域的主导地位构成威胁。


正如先前所述,DeepSeek已经推出了采用性能较低、成本更为经济的芯片的最新产品系列,此举对英伟达施加了压力。


有观点认为,这可能导致其他大型科技公司减少对英伟达更高端产品的采购。


AvaTrade的首席市场分析师凯特·利曼在接受《财富》杂志采访时指出:[投资者对DeepSeek利用性能较弱的AI芯片的能力表示担忧,这可能会影响英伟达在AI硬件市场的主导地位,尤其是考虑到其估值在很大程度上依赖于AI领域的需求。]


值得注意的是,据tomshardware的报道,DeepSeek在AI技术上的突破并未采用英伟达的CUDA平台,而是选择了类似汇编语言的PTX编程方式,这在一定程度上加剧了业界对英伟达未来发展的忧虑。


由于受到DeepSeek的冲击,美国芯片行业巨头英伟达的股价在当日暴跌约17%,博通公司的股价也下跌了17%,AMD的股价下跌了6%,微软的股价下跌了2%。


美国联合能源公司的股价下跌了21%,而Vistra的股价更是下跌了29%。


幻方量化,一家专注于量化投资的公司,早已洞察到AI算力需求的潜在泡沫。


传统AI训练对算力的需求巨大,而英伟达的芯片作为算力的核心,其重要性不言而喻。


然而,DeepSeek的问世使市场认识到,AI对算力的需求并非如先前所预期的那样庞大。


DeepSeek的开源旨在向公众证明,AI实际上仅需原先算力的十分之一。


这一举措进一步加剧了英伟达股价的下跌风险。



若DeepSeek未能达到预期效果,或市场反应不及预期,英伟达的股价可能不会下跌,甚至可能上涨。


从技术竞争角度看,DeepSeek的低成本、高效能技术路径如果被广泛应用,可能会减少市场对英伟达高端GPU的依赖,理论上存在促使幻方量化做空英伟达以获取利益的动机。


但幻方量化此前囤积了上万张英伟达 A100 和 H800 芯片,这些芯片是其技术研发的重要基础,与英伟达也存在着一定的合作关系,这又使得其做空英伟达的行为存在诸多矛盾之处。


尽管目前缺乏明确证据证明幻方量化对英伟达进行了做空操作,但DeepSeek在技术上的突破对英伟达市场地位可能产生的影响,无疑已经引起了市场的广泛关注。


根据券商中国的报道,摩根士丹利在其最新研究报告中宣布,将2025年英伟达GB200的预期出货量从先前的3万至3.5万件大幅削减至2万至2.5万件,最悲观的预测显示出货量可能不足2万件。


此次预期下调可能会对GB200供应链市场造成300亿至350亿美元的影响,给相关供应链及半导体行业带来沉重压力。


摩根士丹利指出,市场对于大型语言模型(LLM)的效率存在争议,例如DeepSeek与微软之间的分歧,预计这些争议在2025年仍将持续,这将使得市场难以对这些股票的价值进行重新评估。


此外,依据周期性规律,云计算行业的资本支出增长速度可能在2025年第四季度减缓至个位数百分比。


尽管如此,摩根士丹利预测,如果历史周期性规律重演,这一增长周期可能会持续至2025年上半年。


随着市场逐渐接近周期顶峰,预计2025年第四季度,同比增长速度将减缓至个位数。


投资者对GB200供应链股票的预期增长过高,可能会对高市盈率的云计算股票产生负面影响。



结尾:技术革新的路径预计将产生影响


①AI初创企业的运营模式将经历转变:那些依赖昂贵GPU集群的AI企业可能会因为成本上的不利地位而面临破产风险。


这将导致二手市场GPU供应量的大幅增加,而中小规模的AI企业则更可能倾向于采购价格更为低廉的低端GPU。


②硬件需求也将经历结构性的转变:自去年以来,以训练为主导的算力需求已经开始向推理侧转移。


未来这种趋势预计将会持续,众多中小AI企业将不再致力于训练基础模型,而是转向采用DeepSeek这类开源模型。


此外,英伟达在训练市场的主导地位也将面临重新评估。


部分资料参考:极客公园:《Deepseek又出连招:刚发布了超越DALL-E3的多模态模型》,字母榜:《DeepSeek推翻两座大山》,量子位:《[DeepSeek甚至绕过了CUDA],工程师灵魂提问:英伟达护城河还在吗?》,Meta财经:《关于幻方私募:当AI算法走进量化世界,无痛[躺赢]?》,私募排排网:《DeepSeek背后的百亿私募大佬基金业绩如何?》,经济观察报:《雷军都来挖人,这家公司想把1%的AI天才藏起来》,半导体行业观察:《成就DeepSeek奇迹的芯片,敲响英伟达警钟》,贝壳财经:《DeepSeek崛起,英伟达暴跌》,华尔街见闻:《DeepSeek最强国产大杀器?英伟达一家就没了近4.3万亿》,甲子光年:《英伟达市值蒸发创纪录,DeepSeek掀起AI算力革命意味着什么?》


本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。



END


推荐阅读:


商务合作请加微信勾搭:
18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论
  • 文/杜杰编辑/cc孙聪颖‍主打影像功能的小米15 Ultra手机,成为2025开年的第一款旗舰机型。从发布节奏上来看,小米历代Ultra机型,几乎都选择在开年发布,远远早于其他厂商秋季主力机型的发布时间。这毫无疑问会掀起“Ultra旗舰大战”,今年影像手机将再次被卷上新高度。无意臆断小米是否有意“领跑”一场“军备竞赛”,但各种复杂的情绪难以掩盖。岁岁年年机不同,但将2-3年内记忆中那些关于旗舰机的发布会拼凑起来,会发现,包括小米在内,旗舰机的革新点,除了摄影参数的不同,似乎没什么明显变化。贵为旗
    华尔街科技眼 2025-03-13 12:30 201浏览
  • 一、行业背景与用户需求随着健康消费升级,智能眼部按摩仪逐渐成为缓解眼疲劳、改善睡眠的热门产品。用户对这类设备的需求不再局限于基础按摩功能,而是追求更智能化、人性化的体验,例如:语音交互:实时反馈按摩模式、操作提示、安全提醒。环境感知:通过传感器检测佩戴状态、温度、压力等,提升安全性与舒适度。低功耗长续航:适应便携场景,延长设备使用时间。高性价比方案:在控制成本的同时实现功能多样化。针对这些需求,WTV380-8S语音芯片凭借其高性能、多传感器扩展能力及超高性价比,成为眼部按摩仪智能化升级的理想选
    广州唯创电子 2025-03-13 09:26 129浏览
  • 曾经听过一个“隐形经理”的故事:有家公司,新人进来后,会惊讶地发现老板几乎从不在办公室。可大家依旧各司其职,还能在关键时刻自发协作,把项目完成得滴水不漏。新员工起初以为老板是“放羊式”管理,结果去茶水间和老员工聊过才发现,这位看似“隐形”的管理者其实“无处不在”,他提前铺好了企业文化、制度和激励机制,让一切运行自如。我的观点很简单:管理者的最高境界就是——“无为而治”。也就是说,你的存在感不需要每天都凸显,但你的思路、愿景、机制早已渗透到组织血液里。为什么呢?因为真正高明的管理,不在于事必躬亲,
    优思学院 2025-03-12 18:24 120浏览
  • 一、行业背景与需求痛点智能电子指纹锁作为智能家居的核心入口,近年来市场规模持续增长,用户对产品的功能性、安全性和设计紧凑性提出更高要求:极致空间利用率:锁体内部PCB空间有限,需高度集成化设计。语音交互需求:操作引导(如指纹识别状态、低电量提醒)、安全告警(防撬、试错报警)等语音反馈。智能化扩展能力:集成传感器以增强安全性(如温度监测、防撬检测)和用户体验。成本与可靠性平衡:在复杂环境下确保低功耗、高稳定性,同时控制硬件成本。WTV380-P(QFN32)语音芯片凭借4mm×4mm超小封装、多传
    广州唯创电子 2025-03-13 09:24 147浏览
  • DeepSeek自成立之初就散发着大胆创新的气息。明明核心开发团队只有一百多人,却能以惊人的效率实现许多大厂望尘莫及的技术成果,原因不仅在于资金或硬件,而是在于扁平架构携手塑造的蜂窝创新生态。创办人梁文锋多次强调,与其与大厂竞争一时的人才风潮,不如全力培养自家的优质员工,形成不可替代的内部生态。正因这样,他对DeepSeek内部人才体系有着一套别具一格的见解。他十分重视中式教育价值,因而DeepSeek团队几乎清一色都是中国式学霸。许多人来自北大清华,或者在各种数据比赛中多次获奖,可谓百里挑一。
    优思学院 2025-03-13 12:15 188浏览
  • 文/Leon编辑/cc孙聪颖作为全球AI领域的黑马,DeepSeek成功搅乱了中国AI大模型市场的格局。科技大厂们选择合作,接入其模型疯抢用户;而AI独角兽们则陷入两难境地,上演了“Do Or Die”的抉择。其中,有着“大模型六小虎”之称的六家AI独角兽公司(智谱AI、百川智能、月之暗面、MiniMax、阶跃星辰及零一万物),纷纷开始转型:2025年伊始,李开复的零一万物宣布转型,不再追逐超大模型,而是聚焦AI商业化应用;紧接着,消息称百川智能放弃B端金融市场,聚焦AI医疗;月之暗面开始削减K
    华尔街科技眼 2025-03-12 17:37 256浏览
  • 引言汽车行业正经历一场巨变。随着电动汽车、高级驾驶辅助系统(ADAS)和自动驾驶技术的普及,电子元件面临的要求从未如此严格。在这些复杂系统的核心,存在着一个看似简单却至关重要的元件——精密电阻。贞光科技代理品牌光颉科技的电阻选型过程,特别是在精度要求高达 0.01% 的薄膜和厚膜技术之间的选择,已成为全球汽车工程师的关键决策点。当几毫欧姆的差异可能影响传感器的灵敏度或控制系统的精确性时,选择正确的电阻不仅仅是满足规格的问题——它关系到车辆在极端条件下的安全性、可靠性和性能。在这份全面指南中,我们
    贞光科技 2025-03-12 17:25 156浏览
  • 北京时间3月11日,国内领先的二手消费电子产品交易和服务平台万物新生(爱回收)集团(纽交所股票代码:RERE)发布2024财年第四季度和全年业绩报告。财报显示,2024年第四季度万物新生集团总收入48.5亿元,超出业绩指引,同比增长25.2%。单季non-GAAP经营利润1.3亿元(non-GAAP口径,即经调整口径,均不含员工股权激励费用、无形资产摊销及因收购产生的递延成本,下同),并汇报创历史新高的GAAP净利润7742万元,同比增长近27倍。总览全年,万物新生总收入同比增长25.9%达到1
    华尔街科技眼 2025-03-13 12:23 157浏览
  • 2025年,科技浪潮汹涌澎湃的当下,智能数字化变革正进行得如火如荼,从去年二季度开始,触觉智能RK3562核心板上市以来,受到了火爆的关注,上百家客户选用了此方案,也获得了众多的好评与认可,为客户的降本增效提供了广阔的空间。随着原厂的更新,功能也迎来了一波重大的更新,无论是商业级(RK3562)还是工业级(RK3562J),都可支持NPU和2×CAN,不再二选一。我们触觉智能做了一个艰难又大胆的决定,为大家带来两大重磅福利,请继续往下看~福利一:RK3562核心板149元特惠再续,支持2×CAN
    Industio_触觉智能 2025-03-12 14:45 58浏览
  • 各大Logo更新汇报 | NEW百佳泰为ISO/IEC17025实验室,特为您整理2025年3月各大Logo的最新规格信息。USB™▶ USB Type-C/PD 互操作性MacBook Pro 16英寸(Apple M4 Max 芯片,36GB 内存–1TB SSD–140W USB-C电源适配器)或 MacBook Pro 16英寸(M4 Pro芯片,24GB内存–512 TB SSD–140W USB-C电源适配器),这些型号支持USB4 80Gbps传输速度和 140W EPR功率。需尽
    百佳泰测试实验室 2025-03-13 18:20 204浏览
  • 在海洋监测领域,基于无人艇能够实现高效、实时、自动化的海洋数据采集,从而为海洋环境保护、资源开发等提供有力支持。其中,无人艇的控制算法训练往往需要大量高质量的数据支持。然而,海洋数据采集也面临数据噪声和误差、数据融合与协同和复杂海洋环境适应等诸多挑战,制约着无人艇技术的发展。针对这些挑战,我们探索并推出一套基于多传感器融合的海洋数据采集系统,能够高效地采集和处理海洋环境中的多维度数据,为无人艇的自主航行和控制算法训练提供高质量的数据支持。一、方案架构无人艇要在复杂海上环境中实现自主导航,尤其是完
    康谋 2025-03-13 09:53 187浏览
  • 前言在快速迭代的科技浪潮中,汽车电子技术的飞速发展不仅重塑了行业的面貌,也对测试工具提出了更高的挑战与要求。作为汽车电子测试领域的先锋,TPT软件始终致力于为用户提供高效、精准、可靠的测试解决方案。新思科技出品的TPT软件迎来了又一次重大更新,最新版本TPT 2024.12将进一步满足汽车行业日益增长的测试需求,推动汽车电子技术的持续革新。基于当前汽车客户的实际需求与痛点,结合最新的技术趋势,对TPT软件进行了全面的优化与升级。从模型故障注入测试到服务器函数替代C代码函数,从更准确的需求链接到P
    北汇信息 2025-03-13 14:43 171浏览
  • 在追求更快、更稳的无线通信路上,传统射频架构深陷带宽-功耗-成本的“不可能三角”:带宽每翻倍,系统复杂度与功耗增幅远超线性增长。传统方案通过“分立式功放+多级变频链路+JESD204B 接口”的组合试图平衡性能与成本,却难以满足实时性严苛的超大规模 MIMO 通信等场景需求。在此背景下,AXW49 射频开发板以“直采+异构”重构射频范式:基于 AMD Zynq UltraScale+™ RFSoC Gen3XCZU49DR 芯片的 16 通道 14 位 2.5GSPS ADC 与 16
    ALINX 2025-03-13 09:27 142浏览
  • 现代旅游风气盛行,无论国内或国外旅游,导航装置无疑就是最佳的行动导游;在工作使用上也有部分职业(如:外送服务业)需要依靠导航系统的精准,才能将餐点准确无误的送至客户手上。因此手机导航已开始成为现代生活上不可或缺的手机应用之一。「它」是造成产品潜在风险的原因之一外送服务业利用手机导航,通常是使用手机支架固定在机车上,但行进间的机车其环境并不一定适用于安装手机,因行进间所产生的振动可能会影响部分的功能,进而导致受损。您是否曾在新闻报导中看过:有使用者回报在机车上使用手机架导航会造成相机无法开启?苹果
    百佳泰测试实验室 2025-03-13 18:17 232浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦