随着CarPlay、Android Auto以及Echo Auto等平台渗透乘用车市场,车内语音识别技术预期将成为主流;但仍有一个答案未知的问题是:市场上有任何语音启动技术已经准备好因应车内的关键任务了吗?

在今年1月举行的国际消费性电子展(CES)上,当媒体看到高通(Qualcomm)展示了在其车内Smart Audio平台上的Amazon Alexa语音识别功能,就对未来发展有了一些想象。高通的展示预示,车内虚拟助理将会使得语音成为驾驶人与车辆之间的自然沟通接口。

高通的展示中最令人印象深刻的一幕,是Alexa在高通的某个高层说话时打断他,说:“不对!这不是真的。”欧喔…在展示中发生这种小“突槌”事件在所难免;而且另一方面,目前的商用语音处理系统也会发生这种语音处理失误。

语音识别系统通常辨识度不佳,特别是在吵杂的环境中;车内就是一个非常吵杂的环境。来自以色列的新创公司Hi Auto执行长暨共同创办人Roy Baharav在接受EE Times访问时就指出:“你可以想象坐后座的小孩们在吵闹、救护车从旁边呼啸而过,还有大雨打在车顶上…”

为了消除噪音以及改善车内语音识别的可靠度,Hi Auto开发了一种视觉语音(audio-visual)解决方案,利用了面对驾驶人的摄影机以及单个麦克风,以深度学习算法追踪嘴唇运动,这种整合式的“视觉语音”解决方案会锁定驾驶人,同时清除其他麦克风与噪音。

而预期的输出则是“干净的音讯”,Hi Auto声称如此能实现更准确的语音识别以及清晰的对话;该公司的计划是提供“只有软件”、不搭配特定硬件的系统。

车内语音识别

语音输入可望成为终极语音接口,但也只是“可望”;今日的语音输入技术相对较新,对很多人来说,跟一个没有生命的物体交谈还是感觉很怪。所以如何养成人们在车内使用语音控制接口的习惯?毕竟Hi Auto的成功取决于语音控制普及性,特别是在汽车产业。

对此Baharav表示:“在很多高端车款中,语音控制已经被广泛采用,而且这种技术也渐渐渗透到大众车款;”这种趋势得益于支持语音控制接口的车用资通讯娱乐系统越来越受欢迎。而且他认为,车内资通讯娱乐系统的语音助理不只有娱乐功能,“将负责关键任务。”

Baharav进一步解释,首先透过可视接口控制的各种车内装置功能,已经变成驾驶人分心的原因之一;其次,汽车产业正面临越来越严格的安全法规;第三,已经习惯在家里使用Amazon Echo或是Google Home等语音助理的消费者,也在寻求车用的类似方案。
20191119-400.jpg
根据市场分析机构voicebot.ai的2019年最新调查,美国有60%消费者在购车时会将语音助理系统做为考虑条件之一。
(来源:Voicebot.ai)

而且Hi Auto也不是唯一看好“会说话的车子”的公司;Baharav估计,目前该市场上约有5亿美元规模,成长也非常快速。他举例指出,已经在该市场上经营一段时间的、从语音识别业者Nuance独立而出的Cerence,就被认为一年的营收达到3亿美元;还有一家公司SoundHound在市场上的版图也持续扩张。

分析师预期,透过语音助理衍生的商业与广告收入将在2025年达到200亿美元,而且车用将会是主要的贡献者之一。而根据Baharav观察,对汽车产业来说更重要的是,车厂将车用资通讯娱乐系统的差异化视为打品牌的关键,因此这是一个可利用的好机会。

Baharav解释:“随着语音控制变得越来越重要(Google预期2020年有五成的在线搜寻是透过语音),车厂也觉得他们必须要支持这种接口;”如果有人忽略了快速成长的语音搜寻市场发展趋势,会有被淘汰的危险。

语音控制能用在关键任务?

语音控制最立即性的应用是车用资通讯装置接口,驾驶人能以语音指令完成打电话、发简讯、播放多媒体,或是导航等等功能。还有什么其他需要跟车子说话的理由吗?

Baharav表示:“想象一下共乘车还有家庭用车;”当车内有不只一个的资通讯娱乐系统需要控制,而且要一次处理好几个语音指令,高质量的车内语音技术会变得非常重要。此外随着先进驾驶辅助系统(ADAS)功能越来越多样化,他预见未来驾驶人可以出声指挥车子变换车道、超车,或者是停进某个停车格,而且其可靠度以及抗噪音的能力会让人惊艳。

推动创新的基本力量,来自于车厂对于牢牢掌握数字体验方案的渴望;但并非让驾驶人习惯CarPlay、Android Auto,而是希望消费者使用车厂自家的车用资通讯娱乐系统(IVI)。Baharav指出,在这种情况下,车厂们将会提供原厂内建、使用者友善的IVI,而且支持热门的音乐串流、数字广播或实时通讯应用程序。

他补充指出,对车厂来说,更重要的是“将IVI与自家开发的地图软件、广播、通话/简讯支持、车身控制、ADAS互动,还有涉及其他车身硬件的软件程序结合;”随着这些车内应用程序不断增生,车厂必须要具备至少能与Google Assistant与Siri媲美的语音控制技术。

很遗憾的是,“目前个别解决方案在语音助理质量方面仍嫌不足,特别是在吵杂的环境中;”Hi Auto期望能藉由针对车内环境永恒存在的瞬间吵杂问题、还有人们习惯在车内交谈的情况提出解决方案来让自己与众不同:“我们必须确保车子听清楚驾驶人说什么。”

若是车内语音控制指令失效…

Hi Auto的明确目标是,藉由改善语音分离(speaker separation)以及强化语音识别,在车用语音控制市场占据一席之地。我们询问了Baharav目前的智能手机或智慧扬声器在噪音消除能力上不足的几个应用场景。

例如一个爸爸驾驶休旅车载女儿们还有她们的朋友们一起去练足球,他注意到汽油快没了,不过他们在高速公路上,需要改变导航的方向。他不想花太多时间滑触控屏幕去找加油站,但是车子里的噪音太大了(很多小孩在叽叽喳喳),车子听不清楚爸爸的指令。

Baharav表示:“这种情况无法以最先进的指向性麦克风来解决,因为孩子们坐在爸爸后面;而噪音消除也无法解决这个噪音,因为并非静态的,无法学习并消除。”

另一个例子是,一位女性驾驶在大雷雨中开车上高速公路要去上班;在雷鸣闪电中,车子的报器响了,暖气的风扇已经开到最大。她想告诉同事她上班会迟到,但发简讯太危险,所以她对着车内系统用讲的,但系统的反应却一直是:“抱歉,请说大声点…”

Baharav表示,这个情况也无法用最先进的指向麦克风来解决,因为噪音来自四面八方。噪音消除也无法解决噪音,因为这同样非静态,无法学习并消除(瞬间噪音)。

Hi Auto近日解除了隐身模式,完成450万美元的种子轮募资,由一家以色列汽车进口商Delek Motors以及其现任董事长Zohar Zisapel主导。其他投资人还包括运输业者Allied Holdings、Goldbell Group与Plug & Play。

这家新创公司预计用种子资金完成第一款产品的开发,并展开销售与扩充团队;Hi Auto表示,已经汽车业界领导厂商安排在2020年初测试其技术。在2020年的CES展之后,Hi Auto打算以软件开发工具包(SDK)的形式推出车内语音解决方案,透过简单的授权方式,或是以软件即服务(SaaS)的模式提供云端API。

编译:Judith Cheng    责编:Yvonne Geng

(参考原文:'Be quiet for a sec? I'm trying to talk to the car.',by Junko Yoshida)

 

阅读全文,请先
您可能感兴趣
近日,蔚来汽车获得独立的造车资质,不少“新势力”造车企业的老大哥们已经从与传统车企代工合作,纷纷获得资质”转正“。获得造车资质的还有理想、小鹏等车企。
一直以来,Arm以向市场提供IP授权业务为主,其合作伙伴基于Arm的IP来开发自家的解决方案和产品。近年来,Arm已经转向为一家计算平台公司,Arm不仅提供IP授权业务,也提供Arm 全面计算解决方案 (Arm® Total Compute Solutions)、Arm Neoverse™平台、Arm Corstone™ 以及 SOAFEE 等完整的计算平台。
早在十多年前,电动汽车就已经引入400V电池系统,现在我们看到行业正在向800V系统迁移,主要是为了支持直流快速充电。随着电压的提高和从400V系统中学到的经验教训,设计人员现在正专注于增强高压保护电路的性能并提高可靠性。他们正在重新评估使用熔丝、接触器或继电器的现有解决方案,以寻找响应速度更快、稳健性更强且可靠性更高的解决方案,如热熔丝和电子熔丝(即E-Fuse)。
未来在CTC电池底盘一体化基础上,如果再高度集成底盘、三电、热管理、被动安全、电子电器架构等领域,就可以在滑板底盘标准化硬件不变的情况下,一辆车最快可以在12个月之内完成工装调整和工艺验证。在此情况下,未来进入汽车领域的门槛也将进一步降低,一些轻资产玩家也可以最低风险进入汽车领域,而且快速实现汽车产品上市,甚至能够开启一轮汽车轻资产“DIY”时代。
半导体IP领域排名前三中,有Synopsys和Cadence两大EDA公司,西门子EDA的前身 Mentor Graphics在创立早期也曾涉足 IP领域。但就国内来说,EDA公司和IP公司之间还是相对独立的。未来这一形势是否会进一步改变,EDA和IP公司之间是否能擦出更多火花?
在2023临港国际半导体大会上,围绕新能源汽车行业对化合物半导体的需求趋势、亟待突破的技术瓶颈、实际应用误区、以及如何形成本土化差异竞争优势等话题,众多企业高管展开了热烈讨论。
根据TrendForce集邦咨询最新OLED技术及市场发展分析报告统计,在近期发表的摺叠新机中,UTG的市场渗透率已逾九成,随着摺叠手机规模持续成长,预估2023年UTG产值将达3.6亿美元;2024年可望挑战6亿美元。
随着终端及IC客户库存陆续消化至较为健康的水位,及下半年iPhone、Android阵营推出新机等有利因素,带动第三季智能手机、笔电相关零部件急单涌现,但高通胀风险仍在,短期市况依旧不明朗,故此波备货仅以急单方式进行。此外,台积电(TSMC)、三星(Samsung)3nm高价制程贡献营收亦对产值带来正面效益,带动2023年第三季前十大晶圆代工业者产值为282.9亿美元,环比增长7.9%。
治精微推出具过压保护OVP、低功耗、高精度运放ZJA3018
无线技术每天都在拯救生命,有些非常方式是人们意想不到的。在美国加利福尼亚州Scotts Valley,一名路过的慢跑者发现一处住宅冒出火焰后,按响了门铃,试图通知屋主。屋主不在家中,但无线门铃连接到了智能家居中枢,提醒屋主慢跑者试图联系。屋主立即向他提供了安全密码,让他跑进房子,从火场中救出了宠物。
点击左上角“锂电联盟会长”,即可关注!锂离子电池是一种二次电池(充电电池),它主要依靠Li+ 在两个电极之间往返嵌入和脱嵌来工作。随着能源汽车等下游产业不断发展,锂离子电池的生产规模正在不断扩大。本文
作者:Jackie Gao,AMD工程师;来源:AMD开发者社区前言当FPGA开发者需要做RTL和C/C++联合仿真的时候,一些常用的方法包括使用MicroBlaze软核,或者使用QEMU仿真ZYNQ
英伟达(Nvidia)CEO黄仁勋11日表示,将扩大与越南高科技业者的伙伴关系,支持在当地训练研发人工智能(AI)与数字化基础建设领域的人才。黄仁勋还透露在越南设立芯片中心的构想。根据白宫今年9月提升
要点2022 年中国的经济增长不如 2021 年强劲,COVID-19 限制令和持续封锁削弱了中国的经济和制造活动。2022 年,LV 变频器市场增长了 3%,其中大部分增长来自于上一年积压订单的交付
一前言随着信息技术和半导体技术的快速发展,电子产品的类型和功能模块日益多样化,对此要求的传输速率也日益提高,在模块集成度多和传输速率提高的背景下,噪声的耦合问题不可避免的日益增多起来。二整改案例今天分
AMD Vitis™ 高层次综合 ( HLS ) 已成为自适应 SoC 及 FPGA 产品设计领域的一项颠覆性技术,可在创建定制硬件设计时实现更高层次的抽象并提高生产力。Vitis HLS 通过将 C
广告分割线12月11日,据台媒报道,群创(3481.TW)竹南T1厂员工向媒体爆料,群创竹南T1厂将裁员50%!据报道,群创竹南厂工程师预计将减少一半,在线作业员也预计砍一半。群创今天表示,已于第一时
本文来源:物联传媒本文作者:市大妈前几年,对大部分人来说,FWA是一个比较陌生的领域,尽管早在3G和4G时代就已经得到一定的发展。后来,随着5G的发展,FWA作为当前5G应用量级最大的场景之一,被更多
点击左上角“锂电联盟会长”,即可关注!文 章 信 息干法改性工艺新认识,助力锂离子电池高镍正极材料实现高结构稳定和热稳定性能第一作者:吴锋通讯作者:苏岳锋*,陈来*通讯单位:北京理工大学,北京理工大学
 /记得星标我/比大部分人早一步看见未来乡村振兴,产业兴旺是重点。今年是加快建设农业强国的起步之年,在陕西,陕西移动依托自身信息技术优势,在电子商务、养殖业、农业等方面注智赋能,推动特色产业稳步发展,