广告

为语音控制系统降低功耗

时间:2021-10-14 04:00:00 作者:Richard Quinnell 阅读:
在语音控制中,降低功率的创新技术将持续发展,从而将语音启动操作的潜力从线性供电到电池供电设计,一路扩展到实际应用...
广告

仅仅使用语音来控制机器的能力已经成为许多商用和消费系统的流行功能了。但是语音控制的问题在于设备必须始终处于监听状态,这意味着必须随时为其供电。不过,更多的新选择正不断涌现,有助于设计人员为其音控设计降低使用功耗。

要让机器对口语指令做出适当响应,是一项巨大的处理挑战。系统必须先有麦克风来拾取声音、数字器将声音转换成处理器可以运作的形式,然后进行大量的数字信号处理,才能从声音中提取语音信息。所涉及的处理量将取决于需要辨识的指令字符数量。词汇量有限的系统可以使用如图1所示的结构进行本地处理,以进行单词检索,而需要自然语音理解的系统则可使用云端运算资源,进行更多的处理。

图1:典型的语音控制系统必须不断地处理声音,以寻找指令字词。(图片来源:Aspinity)

遗憾的是,大多数的时间并不会有任何的语音指令,浪费了处理和所消耗的功率。如果要求用户先按下按键等动作以启动语音处理,则可以避免这种浪费。但是,如果仅透过语音唤醒以启动系统,则必须始终撷取并处理声音,以免错过任何指令。这使得以电池供电的应用备受关注,因为语音处理的“常时监听”(always on )本质,可能会消耗大量电池。

为了减少浪费力气以及节省功率的考虑,语音处理系统通常会使用“唤醒”词来启动。这种方法所需的功率较小,因为在大多数情况下,语音处理只需要能够辨识某个特定单词,而不是全部功能的词汇。因此,系统可以在监听唤醒词的同时,执行较简单、功耗更少的处理算法,从而暂停整个语音处理工作,直到检索到唤醒词为止。

业界在追寻这种方法时,已经投入大量精力来开发仅需要最小功率的唤醒单词引擎。通常,这些引擎只能辨别几个单词,从而让用户选择可能的唤醒选项。然而,有些引擎能够辨别足够多的单词,以提供有限形式的语音控制,从而提供多个指令。但是,对于更复杂的语音控制,唤醒词引擎的目的只是为了及时启动一些更强大、更耗电的处理功能,以接收并诠释伴随唤醒词而来的语音指令。

这些唤醒词引擎正在不断发展中。例如,最近市场上推出将Retune的VoiceSpot关键词检测算法与CEVA的低功耗数字信号处理(DSP)系列相结合的配对方案。该组合可以执行波束成形和声学回声消除,以便在出现噪声时提高单词辨识以及唤醒词辨识的可靠性。该算法的总内存占用量低于80KB,适用于诸如耳塞、智慧手表和运动相机等更小的电池供电应用。

最近还有另一个方案采用Cyberon的CSpotter算法,搭配瑞萨电子(Renesas Electronics)的RA6系列微控制器(MCU)。该算法使用基于音素(phoneme)的建模,支持30多种语言。它可以作为唤醒词引擎或使用多种不同的指令集,提供本地语音控制。该处理器为数字麦克风提供I2S接口,从而无需使用模拟数字转换器(ADC)。

这两种方法尽管已尽能地减少语音识别任务了,但仍必须依靠数字信号处理来进行唤醒词辨识。这为“常时监听”的电源需求设置了下限,因而在电池供电的应用中可能仍然很麻烦。事实上,还有另一种技术可以为“常时监听”的唤醒词辨识节省更多功率。

模拟机器学习(machine learning)技术是关键。Aspinity为此开发了“可重配置模拟模块化处理器”(RAMP)芯片,首先将声音辨识为语音,然后再尝试确定语音是否提到唤醒词。RAMP芯片赋予系统的功能是在执行任何语音处理之前,先确定所检测到的声音实际上是语音。如图2所示,当没有任何人在说话时,这种预先确定声音是否是语音的功能,让唤醒词引擎能够持续休眠状态。

图2:RAMP芯片由于能先确定某个声音是语音再进行处理,让语音处理过程得以安全地略过其他声音类型。(图片来源:Aspinity)

该芯片使用模拟神经网络来实现这一目标,该模拟神经网络经过训练可以区别人类的语音以及其他声音,然后向语音处理系统发送启动信号,以确定语音是否在说某个唤醒词。为了确保语音处理具有完整的语音工作模式,芯片将会在快取开始之前缓冲500毫秒(msec)的撷取声音。当芯片辨识到声音为语音时,就会将传入的声音(从开始传送数据之前)引导至语音处理系统以进行解释。

这种方法仅在RAMP芯片持续供电时才能维持语音控制系统。每当没有人在讲话时,语音处理硬件(包括唤醒词引擎)就可能保持休眠状态。在大多数情况下,没有语音的时段表示系统运行的大部份时间。相较于唤醒字检测所需的典型数十毫安(mA)电流,RAMP芯片和主机MCU仅需要约25uA的电流。因此,相较于“常时监听”的唤醒字检测,忽略静音和非语音的能力可以节省大量功率。

在语音控制中,这种降低功率的创新很可能继续发展,从而将语音启动操作的潜力从线性供电到电池供电设计,一路扩展到实际应用。无论透过语音控制特定设备是不是个好主意,也无论其电源如何,它都已经成为一种实用的选择了。

责编:Luffy Liu

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 【中国“芯”领袖】微源半导体 – 国产电源管理芯片差 成立于2010年的微源半导体一直专注于以电源管理芯片为主的模拟芯片领域,目前拥有屏幕显示电源、电池管理、电源转换、保护、音频功放、信号链、功率器件及SoC八大产品线,包括显示屏专用PMIC芯片、P-Gamma、电平转换、背光驱动、充电管理、电池保护、过压保护、过流保护、升压芯片、降压芯片、线性稳压器LDO、栅极驱动、半桥全桥、运放、快充协议和音频功放等16大类产品......
  • “双碳”目标下隔离电源的新变化 碳中和、5G、AI、大数据等技术趋势正在改变电源产品的设计理念,市场对中大功率电源以及与之相关的隔离技术需求已大幅攀升。
  • 【中国“芯”领袖】赛微微电子:10年专研电池及电源管理 作为ASPENCORE旗下China Fabless项目的一个重要板块,【中国“芯”领袖】特别报道系列精心挑选综合实力和增长潜力均表现突出的中国IC设计公司,通过采访公司高管(创始人/董事长/CEO/CTO/营销负责人)对其进行全方位的展示和深入观察。本期报道的是广东赛微微电子股份有限公司,受访者是市场总监周军先生。
  • 华大半导体领投,积塔半导体完成80亿元战略融资 11月30日,华大半导体旗下积塔半导体宣布完成80亿元人民币战略融资,本轮融资由华大半导体领投。本轮融资将助力积塔半导体发挥自身车规级芯片制造优势,加大车规级电源管理芯片、IGBT和碳化硅功率器件等方面制造工艺的研发力度,加快提升汽车电子制造产能。
  • 中国工程师最喜欢的10大汽车电源管理和功率器件(MOSFET ASPENCORE分析师团队按照汽车电源管理和功率器件的类别(包括MOSFET、IGBT、DC-DC、PMIC、BMS、SiC),分别从5家国际半导体厂商和5家国产半导体厂商各挑选一款车规级Power器件。有的产品类别难以挑选出合适的国产厂商产品,比如车规级MOSFET和BMS(电池管理系统)。请在文末进行微信投票,以评选出您最喜欢的汽车电源管理和功率器件。
  • 利用LT1083构建7.5 A稳压器 设计任何电路板的电源部分时,最常用的稳压器是78XX、79XX、LM317、LM337或类似器件。工程师知道这些控制器安全可靠且易于使用,但它们的电流有限。如果需要更大电流,可以使用ADI LT1083稳压器实现简单实惠的解决方案
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。

  • Qorvo® 推出首款单个模块即可支 Qorvo今日推出首款覆盖5.1GHz至7.1GHz频段的宽带前端模块 (FEM),不仅能最大限度地提高容量,而且还能简化设计,缩短产品上市时间,并将前端电路板空间减少50%,适用于Wi-Fi 6E企业级架构。
  • 5G 基础设施的驱动 根据全球移动通信系统协会 GSMA 提供的数据,5G 目前正在顺利推广中,预计将在 2025 年覆盖全球三分之一的人口。另外根据全球领先综合数据库Statista 的调查,主要手机制造商皆已推出 5G 手机,这将使那些希望以理论上高达 50Gb/s 的最大速度传输数据流和视频的人感到满意,预计到 2023 年全球 5G 订阅量将达到 13 亿 。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了