吉利率先宣布DeepSeek上车

原创 智能车参考 2025-02-07 13:18
贾浩楠 发自 副驾寺
智能车参考 | 公众号 AI4Auto

知道DeepSeek这把“火”迟早点燃车圈,但没想到这么快。

1月20号刚刚发布的大模型R1,就是让全世界尤其是海外“震惊”的那一版,现在已经官宣上车

更没想到,车圈率先拥抱国产顶尖大模型能力的,是它。

谁上车了DeepSeek大模型?

率先上车DeepSeek大模型的是它杭州老乡——吉利汽车

给用户的体验升级,目前集中在人车交互层面。

后续吉利智能汽车AI不仅能对用户的模糊意图实现精准理解,进而准确调用约2000个车载接口,还能基于车内外场景主动分析用户潜在需求,并为用户主动提供车辆控制、主动对话、售后等等服务。

例如自动调整座椅、提醒车辆保养、拥堵时推荐绕行路线,或根据用户日程提前规划充电等等。

可以理解为对吉利原有的交互模型一次全面的升级彻底打通了车机UI、交互助手与数千种汽车原子化功能的壁垒,“可见即可说”不再限定在某些特定领域,扩展到全车智能。

据透露,吉利主要使用了知识蒸馏手段,智能车参考之前详细科普过,主要通过让一个较小的模型学习较大模型的预测分布来获得类似的表现。出现个别的能力不足和输出异常,可以补充有限数据使用强化学习的方案调整。

吉利具体怎么做的没细说,不过可以推测应该是将617B参数的R1大模型,基于星睿自身的车控FunctionCall大模型、主动交互端侧大模型等核心组件进行蒸馏,将R1大模型训练成适应智能汽车交互场景,并且能在车端跑起来的状态,之后在融合进吉利自己的技术体系里。

之所以能这么操作,离不开R1大模型本身的技术特征。

与之前常见的大语言模型不同,R1显著的特征有两个,一是多模态能力更强,二是训练成本更低

前者来自R1的架构级创新,包括Multi-Head Latent Attention(MLA)、DeepSeekMoE和Multi-Token Prediction(MTP)。

MLA解决长序列处理的效率问题,将过程中的键和值压缩成低秩的潜在向量,显著降低了推理过程中的内存占用。这种机制使得DeepSeek-V3能够处理如整本书或高分辨率图像这样的长序列,同时保持较低的计算开销。

MoE模型通过将任务分配给不同的“专家”来处理,即在处理每个 token 时,仅有部分参数被激活,这使得模型能够聚焦于一小部分经过高度训练的专家模块,从而快速且精准地给出答案。

MTP的意思是多token预测目标,即在每个步骤中预测多个未来的token。这种方法增强了模型的文本生成能力,特别是在长文本生成任务中,能够生成更加连贯和上下文丰富的文本。

后者来自训练过程中的创新,比如FP8混合精度训练、DualPipe管道并行性和跨节点全对全通信内核等优化技术,实现了高训练效率。完整训练需要278.8万个H800 GPU小时,成本约为557.6万美元,仅为传统大模型数十分之一。

R1发布两周左右就落地上车,核心依然离不开它强大的多模态能力,以及低廉链接的训练方式、成本。

实际上R1相比以往任何基础大模型,都更容易被应用到千行百业的具体场景中。

而应用在智能汽车上,上车方式不是简单在吉利的车机上安装一个DeepSeek应用,背后DeepSeek给吉利的技术支持,不再仅仅局限于授权一个API,而是把震惊全世界的R1大模型能力,融合进吉利自己的技术体系。

车企没有AI能力,接不住DeepSeek

何小鹏是第一个公开谈论DeepSeek的车企老板,昨天刚刚在内部开工信中承认DeepSeek在AI领域取得了显著成就,并预测AI将在未来十年驱动汽车行业产生巨大变革。

随着吉利的新进展,后续DeepSeek毫无疑问会迎来一波上车热潮,各家争先恐后官宣。

DeepSeek大概率会成为类似华为ADS、高通8295、英伟达Orin一样的旗帜图腾,深深烙印在用户思维中,成为智能车的核心产品力和卖点之一

不过和这些具体的产品功能相比,DeepSeek对于整个智能汽车产业影响可能更深远。

吉利与DeepSeek的合作方式,是将R1模型的知识能力蒸馏融合进自研模型。实际上这也是目前DeepSeek在千行百业落地的模式。

因为DeepSeek率先实现了高性能低成本、泛化能力好又方便部署的大模型,不必(或者说当下也没条件)分出团队针对某种应用场景专门研发模型。

所以作为车企,没自己的东西,还真接不住DeepSeek:必须具有大模型基础能力和产品,以及综合研发、维护、迭代的体系化AI能力。

这也是从车企角度看,吉利会成为第一个官宣上车DeepSeek的原因。

整个星睿大模型是一个技术体系,吉利已经搭建了3年之久。包括车控大模型、主动交互端侧大模、云端大模型、多模态融合引擎、算力基础设施等等。整合了自然语言处理(NLP)、计算机视觉(CV)、语音识别、多模态交互等AI技术,支持车辆控制、语音交互、场景化服务等功能。

DeepSeek“上车”后,也不会局限于只能座舱的交互应用。未来,DeepSeek R1的生成能力可以用来模拟复杂驾驶场景,加速算法迭代…

所以最前沿的大模型技术进入汽车行业,眼下还不是大水漫灌让所有玩家水涨船高,只有自身AI能力积累最深的头部车企,才能接住最早的一波红利。

以前是AI公司专门成立汽车团队和子公司,以项目形式作为乙方交付;国产基础大模型突破后,这种合作方式被颠覆,车企需要根据大模型的特征调整自己的技术体系和功能落地。

当然对车企本身自研能力和大模型基础提出更高要求。

— 联系作者 —

智能车2024年度评选结果

在经过广泛征集、专业推荐,以及智能车参考垂直社群的万人票选后,智能车2023年度评选结果正式发布。涵盖三类奖项:

· 十大智能车年度人物

· 十大智能车车型

· 十大智能车技术方案/产品

在汽车工业迎来百年未有之大变局时,我们希望能以此提供智能维度的参考和注脚。

其中,十大智能车技术方案/产品是:

<< 左右滑动查看更多>>


—  —

智能车参考】原创内容,未经账号授权,禁止随意转载。

点这里👇关注我,记得标星,么么哒~


智能车参考 在这里读懂智能汽车变革
评论
  • 在招聘合适的人才时,清晰度至关重要。想要找到合适的人选,并确保他们在岗位上取得成功,第一步就是明确职位的关键绩效指标(KPI)和预期成果。但光有这些还不够,如何判断候选人是否具备必要的特质?这时,KSA模型就派上用场了。它是一个简单但强大的方法,能帮助你聚焦于真正影响岗位表现的关键要素。今天,我想和你聊聊这个模型,帮你更轻松地为合适的候选人设定合适的KPI。了解KSA模型KSA代表知识(Knowledge)、技能(Skills)和态度(Attitude),是评估候选人是否适合岗位的三个关键维度。
    优思学院 2025-03-18 15:03 73浏览
  • 文/Leon编辑/cc孙聪颖‍蛇年春晚最有意思的节目,一定非机器人跳舞莫属。就算是遥控或预编程,机器人能够做出如此复杂的动作,在五年前都是不敢想象的事情,其制造商宇树科技也因此火爆全网。就在春节过后不到一个月,会骑自行车的人形机器人诞生了。这背后,是近年来“具身智能”概念的迅猛发展。“我们造了一个跟人一样灵动的机器人!”3月11日,智元机器人联合创始人兼首席技术官彭志辉在微博上说道。在视频中,灵犀X2会骑自行车、能跳《科目三》,还可以与人促膝长谈,甚至拿起葡萄“穿针引线”。在全球人形机器人领域,
    华尔街科技眼 2025-03-17 12:38 113浏览
  • 新兴的个人健康监测技术为何在医疗场景和日常生活中越来越受到青睐?为了准确回答这个关键问题,我们首先需要理解三个全球性趋势:如今,几乎人手一部智能手机,这等于随身携带了一台高性能计算机、一个全天候运行的智能医疗传感器中心,还有一块显示屏。发达工业国家的人口正在迅速老龄化,而老年群体的疾病发病率较高。与此同时,年轻人也比过去更加关注如何延长健康寿命。这些人群以及服务他们的医务人员可以利用新技术来优化生活方式,合理调控运动、饮食、睡眠和压力等关键因素,帮助他们作出更健康的生活选择。如摩尔定律所预言,半
    艾迈斯欧司朗 2025-03-17 21:50 80浏览
  • 近期,据全球物联网市场调研机构IoT Analytics公布数据显示,2025年全球物联网设备连接数预计将突破200亿,同比增长约14%,物联网技术正以稳定上升态势向工业自动化、智慧城市、智慧农业与智慧家居等领域纵深推进。在多样化的应用场景和复杂环境需求的驱动下,物联网无线通信技术的运行功耗、传输距离和频段兼容性正受到前所未有的关注。为增加物联网通信模块的配置灵活度,消除物联网设备的“连接焦虑”,华普微重磅推出了一款自主研发的超低功耗、可兼容Sub-GHz与2.4GHz 双频段的高性能LoRa
    华普微HOPERF 2025-03-18 15:43 71浏览
  • 随着汽车行业逐步迈向电气化和电池动力,位置传感器以及其他长期在车辆中被忽视但却至关重要的小型元器件正逐渐成为关注的焦点。某些电子元器件常常吸引大量关注,例如如今用于训练AI模型的强大GPU几乎每天都出现在新闻中。而其他元器件则默默地执行着重要但鲜为人知的功能。艾迈斯欧司朗一些历史悠久的产品线便隶属于后者,其中包括磁性和电感式位置传感器、电容式传感器和电池监控芯片。工业泵和风扇等产品的制造商利用位置传感器实现电动机高效平稳运行。在车辆的方向盘中安装电容传感器可以保障安全,它可以用于在辅助驾驶模式下
    艾迈斯欧司朗 2025-03-17 22:22 73浏览
  • 在制药行业中,生产工艺的精准控制与产品质量安全密切相关。随着制药工业4.0的发展,传感器作为生产流程的"感知器官",在确保合规性、提升效率、降低风险方面发挥着不可替代的作用。本文将以晨穹电子科技(以下简称"晨穹")的压力、温度、流量及液位传感器为例,解析制药厂关键工艺流程中的传感器应用场景及技术要求。一、制药核心工艺流程中的传感器需求1. 原料处理与配液系统液位监测:储罐内原料液位实时监控需使用卫生型液位计。晨穹磁翻板液位计采用316L不锈钢材质,具备CIP/SIP(在线清洗/灭菌)耐受性,符合
    传感器晨穹 2025-03-18 15:51 87浏览
  •        在工业视觉检测线上,一台搭载传统图像传感器的机器人因高温导致图像噪点激增,误将合格零件判定为瑕疵品,每小时损失超10万元;在深夜的安防监控画面中,模糊的噪点让犯罪分子身影难以识别,导致案件侦破延迟—— 噪声,已成为图像传感器行业的“无声杀手”。据Yole统计,全球约35%的工业检测误差源于传感器噪声干扰,而安防场景下60%的有效信息因低照度噪点丢失。传统方案试图通过单一优化像素或电路来降噪,却陷入“按下葫芦浮起瓢”的困境。  &nb
    中科领创 2025-03-18 10:24 52浏览
  • 晨穹电子一家专业从事研发、生产、销售各类传感器为一体的高新科技企业。1 人赞同了该文章在工业4.0、智能家居、新能源汽车等场景中,传感器作为数据采集的核心器件,其抗电磁干扰(EMC)能力直接影响系统可靠性。尤其在5G通信、高功率电机、无线充电等复杂电磁环境下,传感器的信号失真问题愈发突出。本文结合MEMS传感器、物联网(IoT)设备、边缘计算等热度技术,解析提升传感器抗干扰能力的6大策略。 一、电磁干扰对传感器的威胁; 1、电磁干扰(EMI)会导致传感器出现 。2、信号跳变(
    传感器晨穹 2025-03-18 09:28 85浏览
  • 失效模式与影响分析(FMEA)失效模式与影响分析(FMEA)是一种系统方法,用于识别和分析系统或过程中的潜在失效,广泛应用于工程和制造领域,以提高产品可靠性和安全性。最新标准由 2019 年发布的 AIAG-VDA FMEA 手册(第一版) 定义,该手册结合了美国和欧洲汽车行业的最佳实践,并引入了 七步法,确保分析全面且结构化。图:优思学院六西格玛新版 FMEA 失效分析的七个步骤1. 规划与准备确定 FMEA 研究的 范围、边界和目标。组建跨职能团队(设
    优思学院 2025-03-17 14:43 117浏览
  • 在工业4.0与智能制造深度融合的今天,设备实时性、稳定性和成本效益成为企业核心竞争力的关键。触觉智能将基于RK3506平台,分享工业应用方案,本期为大家带来DSMC串行接口在数控行业的应用。DSMC技术解析底层架构突破双倍数据速率:通过上升沿与下降沿双重触发机制,实现单周期内2倍数据吞吐量,较传统SPI接口效率提升300%。多通道并行:支持8线/16线位宽可配置模式,满足多轴协同场景下的同步通信需求。性能实测标杆超低延迟:FPGA互联场景下,写延时小于75ns,读延时小于260ns,相比PCIe
    Industio_触觉智能 2025-03-18 11:46 58浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦