
【摘要】在汽车“新四化”的发展趋势下,座舱智能化与个性化需求日益增强。通过数据驱动技术,可以在智能座舱中无监督生成场景,从而提升用户体验。采用Apriori 关联规则算法和多指标自动过滤机制,构建无监督场景生成模型。结果表明,该技术能够在无需人工干预的情况下,根据环境数据和用户行为自动生成适应性场景,在提升智能座舱灵活性和个性化服务水平方面有广泛应用潜力。
随着信息技术的飞速发展,汽车座舱作为现代汽车的核心组成部分,正逐渐从单一的驾驶空间转变为集交通驾驶、工作学习、休闲娱乐于一体的智能移动生活终端,成为连接人与汽车、人与社会的重要桥梁。智能座舱的设计理念不断演进,用户需求也从传统的单一功能向个性化、智能化方向转变。在此背景下,智能座舱的交互设计不仅需要满足基本的驾驶需求,更需要通过高度集成化的软硬件系统,实现对驾乘人员的综合服务与体验优化,其设计与优化成为汽车行业发展的关键。
近年来,数据驱动技术在各个领域的应用日益广泛,其在智能座舱中的应用也展现出巨大的潜力。通过分析和处理大量用户数据,智能座舱能够更加精准地理解用户需求,提供个性化的服务。然而,传统的场景生成方法往往依赖于预先设定的规则和人工干预[1–3],这在一定程度上限制了智能座舱的灵活性和创新性。本研究提出的无监督场景生成技术[4,5],能够在无需人工干预的情况下,根据用户行为和偏好自动生成适应性场景,这对于提升智能座舱的用户体验具有重要意义。本文分析智能座舱中的数据,设计并验证数据驱动的无监督场景生成技术方案,旨在为智能座舱的交互设计提供新的思路和方法,推动智能座舱技术的发展。
汽车座舱从传统座舱到电子座舱,再到如今的智能座舱,经历了由指针仪表和按键开关控制空调、收音机等基本功能,到引入中央显示屏,直至实现高集成化、多模交互等全面智能化的发展历程。现代智能座舱不仅需要实现基本的驾驶功能,还需要提供导航、信息娱乐、车辆管理等综合服务,并通过多通道、智能化、沉浸式的人车交互设计方案,提升用户的驾乘体验[6]。智能座舱的设计在集成硬件的同时,更注重于软件的智能化和个性化服务。通过人工智能、大数据等技术,智能座舱能够实现对用户行为的学习和预测,从而提供更加精准和个性化的服务,构建出一个高度个性化的“第三生活空间”[7]。
目前,智能座舱技术已步入快速发展阶段,涵盖了交互界面优化、智能语音助手、增强现实(Augmented Reality, AR)导航、健康监测系统以及多媒体娱乐系统等领域。基于数据分析的个性化推荐系统逐渐成为标配,增强了用户在驾驶过程中的互动体验。同时,车内人机交互方式在人工智能技术的迭代更新下不断进化,通过语音识别、手势识别、人脸识别,甚至情感识别[8]等多模态交互方式,实现了更加自然和人性化的人机交互。
尽管智能座舱技术取得了显著的进步,但在实际应用中仍面临诸多挑战和技术需求。一方面,如何高效整合并利用车内产生的海量数据,包括但不限于驾驶行为、环境感知、用户偏好等,以实现更深层次的个性化服务和智能决策支持,是亟待解决的问题;另一方面,随着用户对隐私保护意识的增强,如何在保障数据安全与隐私的前提下,实现数据的有效利用,成为智能座舱技术必须解决的问题。此外,智能座舱还需要一套能够自动学习、自我优化的数据处理机制,以应对复杂多变的用户需求和驾驶场景。特别是对于场景生成技术,传统基于规则的方法限制了智能座舱适应性和创新能力的发挥。因此,探索数据驱动的无监督学习技术,在减少人工干预的同时,自动生成与用户行为紧密匹配的场景,是智能座舱技术发展和应用的重要方向。
本研究中数据驱动的无监督场景生成技术由数据收集与处理和无监督场景生成模型两部分组成,技术路线如图1所示。

图1 数据驱动的无监督场景生成技术路线
在智能座舱技术框架下,高效的数据收集与处理机制是实现无监督场景生成技术的前提。本方法旨在构建一个精确、可靠的数据基础,以支撑智能场景的自动生成。
2.1.1 数据收集
智能座舱中涉及的主要数据包括环境数据和车机信号数据,通过车内外传感器和不同功能模块和交互节点上设置数据采集点(即埋点),实时监测和上报状态变化。
(1)环境数据:车辆的外部环境信息,具体有天气状况(天气类型、温度、湿度、空气质量等),季节,时间段等,用于评估驾驶风险、优化行驶策略等。
(2)车机信号数据:车辆本身运行状态的各类数据,具体有驾驶行为数据(瞬时车速、转向盘转角、加速、制动等),车内状态数据(车窗车门、座椅位置、空调、音响等),用户与座舱系统的交互记录(如触控操作、语音指令等),这些数据直接反映了车辆的运行特性和用户的使用习惯。
2.1.2 数据预处理
为了确保数据质量与可用性,原始数据上报后,需要进行数据清洗和提取,从而得到统一序列数据模型,便于后续数据分析。
(1)数据清洗:通过缺失值处理、异常值检测等操作,去除原始数据中的噪声和无效信息,保障数据的准确性与完整性。
(2)数据提取:将清洗后的数据进行筛选、分区,提取情境特征(主要为环境特征和车辆状态特征)和车控行为。对于连续性特征,需进行离散化处理,以满足数据分析的要求。
在车载交互领域,场景是指参与者、环境、目标和目的、行动和事件的顺序,以及假设的上下文描述[9]。本研究中的场景是指结合了情境特征和驾乘人员行为的整体描述。通过模型挖掘出特征与行为、行为与行为的关联关系,自动生成有实际应用价值的场景(见图2)。

图2 场景生成示意
本研究搭建的无监督场景生成模型包括关联分析和多指标自动过滤,模型涉及到大量逻辑复杂的计算,使用Apache Spark进行数据处理。
2.2.1 关联分析
采用Apriori关联规则算法,该算法是最有影响的关联规则算法,其利用逐层搜索的迭代方法找数据集中的频繁项集,进而产生关联规则[10],发现情境特征与车控行为之间存在的关联关系和模式,为场景配置提供依据。
2.2.2 多指标自动过滤
本研究使用多个指标度量关联规则,来综合判断关联程度,筛选出有实际应用意义的组合形成场景。
关联规则常用的3个度量指标[11,12]:
(1)支持度(Support):某个项集出现的频率。如“天气=雨雪”(X)与“打开座椅加热”(Y)同时出现的支持度表示为:
式中:sup(X ∩Y) 为X 和Y 同时出现的支持度,sum(X ∩Y)为X和Y同时出现的频数,sum(N)为总项集的频数。
(2)置信度(Confidence):X 出现的情况下,Y 也出现的概率,即Y的条件概率,表示为:
式中:conf(X →Y)为X和Y的置信度。
(3)提升度(Lift):反映X 与Y 的相关性,衡量二者的出现是否相互独立,表示为:
式中:lift(X →Y)为X 和Y 的提升度。lift>1 且越高表明正相关性越强,lift<1 且越低表明负相关性越强,lift=1表明没有相关性。
由于提升度会受到零事务数量的影响,本研究加入两项具有零事务不变性的相关性度量Kulczynsky值和不平衡比[10,13]:
(4)Kulczynsky 值:评估项集之间的相关性,对于相关性的度量与数据集大小无关,表示为:
式中:Kulc(X,Y)为X 和Y 的Kulczynsky 值。Kulc 值取值范围为[0,1],取值越高表明正相关性越强。
(5)不平衡比(Imbalance Ratio):评估项集之间的不平衡程度,可用来衡量不同项集数据量的差异,表示为:
式中:IR(X,Y)为X 和Y 的不平衡比。IR 取值范围为[0,1],取值越低表明数据量差异越小,项集之间平衡程度越高。
根据模型仿真和测试,设定3个指标的阈值为:

综上所述,本文采用lift、Kulc 值和IR 三个指标联合度量项集之间的关联关系,设定指标阈值来过滤筛选可靠的关联组合,生成更符合用户需求的场景模式。
本文的原始数据来自某项目车型的埋点数据,获取数据之前均与用户签署隐私协议,主要数据为2.1.1中提及的车机信号数据和环境数据,包含2024 年6 月28 日至2024 年7 月27 日共30 天活跃车辆的行程记录,日活跃车辆数均超过30 000 辆。经数据清洗后,提取情境特征和车控行为。其中,情境特征反映场景在一段时间内的持续属性和特点,车控行为是瞬时的动作或反应。同时,剔除重复度较高、分布极不均衡以及对车控行为无影响的特征。
情境特征包含8 个环境特征和46 个车辆状态特征,共计54 项(特征示例见表1);车控行为包含蓝牙、空调、地图、多媒体等19 个领域类别,共计445 个(行为示例见表2),处理得到用户行程操作统一数据模型表(见表3)。
表1 情境特征展示

表2 车控行为展示

表3 用户行程操作统一数据模型表

根据数据分布,案例部分选取高频特征“温度=热”(27 ℃<温度≤34 ℃)做具体展示及分析。如图3所示,研究时间内,日活跃车辆数均超过30 000 辆,处于“温度=热”特征下的车辆数均超过25 000 辆,“温度=热”车辆数在活跃车辆数中的占比均大于70%。

图3 日活跃车辆数与“温度=热”特征车辆数情况
利用无监督场景生成模型挖掘“温度=热”特征的关联行为,运用关联分析计算“温度=热”特征与各个行为的3 个关联指标,指标过滤后的结果如表4 所示。“温度=热”特征的关联行为有3 个,分别为设置空调风量、设置空调温度和开始导航,表示在温度为热的情况下用户有更大可能会进行这3 个操作。“温度=热”与“设置空调风量”的lift 和Kulc 值最大,说明二者关联程度最强,IR 值较小,说明二者样本量差异较小,数据比较平衡。与“设置空调温度”的关联程度次之。设置空调风量和温度的行为意图均为调整车内温度,反映出温度为热状态下用户的主要需求。与“开始导航”存在关联关系,是由于天气较热时,用户出于舒适性考虑,一般会使用导航选择荫凉或者最快的路线。“温度=热”特征与这3 个行为生成通用场景,当温度范围为27~34 ℃,可以为用户推荐设置空调风量、设置空调温度、开始导航,其中设置空调风量可作为优先推荐。
表4 特征“温度=热”与行为关联分析

表5展示了“设置空调风量”行为与其他行为的关联分析和过滤结果。设置空调风量的关联行为有5个,关联程度从高到低分别为空调_大风量、空调_小风量、设置空调温度、出风模式_吹脸和集控中心_情景模式_呵护宝贝_开,表示用户在设置空调风量后更有可能出现这5 个行为,可按照关联程度为用户推荐这些操作。由于个人用户的操作习惯不同,在设置空调风量之后的高频行为存在很大差异(如表6所示),3位用户的高频行为分别是出风模式_吹脸、空调_大风量和设置空调温度,根据不同用户的习惯进行个性化推荐。
表5 行为“设置空调风量”与行为关联分析

表6 个人用户行为差异

通过无监督场景生成技术,可以实现[温度=热→设置空调风量]、[温度=热→设置空调风量→空调_大风量]等通用场景的生成,还能根据个人用户的操作习惯适配不同场景,实现个性化推荐。
为了进一步验证无监督场景生成技术的实际应用价值,本研究在台架上进行测试。搭建的测试环境主要由中央显示屏和驾驶环境模拟软件组成。将无监督场景生成模型部署在测试环境中,配置软件参数创建虚拟环境,重点设置天气条件。在上车阶段,当前温度设置为31 ℃(特征“温度=热”),中央显示屏弹出场景模式卡片,推荐内容为“空调风量推荐——为你调大风量”(见图4)。测试结果说明,无监督场景生成模型能根据特征自主挖掘关联行为,生成场景,给用户提供智能推荐。

图4 台架测试场景模拟推荐
数据驱动的无监督场景生成技术不仅为座舱技术提升用户体验开辟了新路径,也在多个维度展现了其潜在的应用价值。
(1)用户体验优化。无监督场景生成技术通过分析用户行为和情境变化,自适应地推荐座舱内部设置和娱乐内容,如根据天气变化推荐用户调节空调模式、在通勤时段提供用户偏好的新闻广播,创造更为舒适和谐的乘车环境。还将持续学习用户的偏好,逐步优化长期使用体验,使得智能座舱成为真正理解用户需求的个性化空间。
(2)驾驶安全增强。在安全方面,该技术会识别危险驾驶模式,如紧急刹车、疲劳驾驶等,及时预警并提供干预措施,如启动自动驾驶辅助功能或建议休息点。同时结合环境数据,如雨天路面湿滑,系统能提前推荐调整车辆控制参数,如增加制动力度,提高行车安全性。
(3)智能决策支持与资源优化。基于该技术,可以更好地理解市场趋势和用户需求,指导智能座舱产品设计与升级方向,如分析不同场景下的能源消耗模式,优化电池管理系统,延长电动汽车续航里程;还能实现资源的智能调度,如根据车流量自动调整停车场资源分配,减少等待时间,提高整体运营效率。
(4)驾驶行为模拟与预测。利用该技术分析大量驾驶数据,自动生成多样的驾驶场景和行为模式,用于模拟不同驾驶风格或应对特殊交通状况,有助于开发更智能的驾驶辅助系统,还能在虚拟环境中测试车辆性能和安全性,减少真实世界测试的风险和成本。
数据驱动的无监督场景生成技术在智能座舱的应用前景广阔,提升用户体验和安全性的同时,一定程度上推动智能交通系统的发展,为智慧出行奠定技术基础。
本文提出了一种数据驱动的无监督场景生成技术方案,通过实际案例分析,展示了该技术在智能座舱中数据资源收集与处理、理解用户行为、适应环境变化及提供个性化服务方面的能力,实现了无需人工干预的场景自动生成,验证了技术方案的有效性,也体现了技术的实际应用价值。
未来的研究需进一步改进算法的鲁棒性,探索智能座舱多模态数据融合,如情感识别、生物特征监测等,提升模型的自我学习能力以及场景生成的丰富性和准确性。
参 考 文 献
[1] 王淳浩, 闭家铭, 阮利, 等. 自动驾驶安全关键场景生成技术综述[J]. 信息与控制, 2024, 53(1): 17-32, 46.
[2] DING W, XU C, ARIEF M, et al. A Survey on Safety-Critical Driving Scenario Generation: A Methodological Perspective[J]. IEEE Transactions on Intelligent Transportation Systems, 2023, 24(7): 6971-6988.
[3] CAI J, DENG W, GUANG H, et al. A Survey on Data-Driven Scenario Generation for Automated Vehicle Testing [J]. Machines, 2022, 10(11): 1101.
[4] VRBANIĆ F, MILETIĆ M, IVANJKO E, et al. Creating Representative Urban Motorway Traffic Scenarios: Initial Observations[C]// 2021 International Symposium ELMAR,Zadar, Croatia, 2021: 183-188.
[5] WEBER N, THIEM C, KONIGORSKI U. Toward Unsupervised Test Scenario Extraction for Automated Driving Systems from Urban Naturalistic Road Traffic Data[J]. SAE International Journal of Connected and Automated Vehicles, 2023, 6(3): 263-281.
[6] 《中国公路学报》编辑部. 中国汽车工程学术研究综述·2023[J]. 中国公路学报, 2023, 36(11): 1-192.
[7] 蔡萌亚, 王文丽. 汽车智能座舱交互设计研究综述[J]. 包装工程, 2023, 44(6): 430-440.
[8] 张双烨, 董占勋, 李亚鸿, 等. 面向智能座舱的情感计算框架及其交互设计研究[J]. 包装工程, 2024, 45(12): 49-55.
[9] 覃京燕, 何嘉聪. 无人驾驶车元宇宙智能座舱的场景交互设计研究[J]. 包装工程, 2023, 44(18): 67-76.
[10] 韩家炜, Kamber M. 数据挖掘: 概念与技术(第3 版)[M].北京: 机械工业出版社, 2012.
[11] 纪文璐, 王海龙, 苏贵斌, 等. 基于关联规则算法的推荐方法研究综述[J]. 计算机工程与应用, 2020, 56(22): 33-41.
[12] 李美玲, 李子辉, 陈雪珲, 等. 基于关联规则的高速公路交通事故风险识别[J]. 山东建筑大学学报, 2024, 39(3):99-106.
[13] 甘文生. 效用挖掘技术及其应用[D]. 哈尔滨: 哈尔滨工业大学, 2020.