或许您还没有听说过,2017年已经被称为“语音接口年”了。从年初美国拉斯维加斯国际消费电子展(CES)的“语音启动”成为最受瞩目的焦点开始,话题持续延烧到年中在上海举行的世界移动通讯大会(MWC)。这一称号并进一步受到多家因特网和技术巨擘的加持,他们不断加入竞赛行列并推出以智能扬声器为基础的个人语音助理。

美国的智能扬声器

自从2014年亚马逊(Amazon)智能扬声器Echo推出以来,这个市场一直呈指数级成长。根据audioxpress.com,在美国,智能扬声器占家庭音频硬件类别的30%。预计未来几年将持续成长,到2020年将可达到1亿美元的规模,其中75%的美国家庭将拥有智能扬声器。

Google Home扬声器自去年发布后,成功地占据了一定的市场份额,但仍远落后于Echo。根据eMarketer US对2017年的预测,Amazon Echo扬声器将拥有70.6%的市占率,Google Home约达到23.8%,而剩下的市场将分布于联想(Lenovo)、Harman Kardon和LG等市占率更小的参与业者。 20170914-audio-1 图1:技术领域的各大巨擘现正竞相争夺您咖啡桌上的一小块圆形空间 (来源:Reuters/Harman Kardon)

不过,在Apple发布其高价位的高阶扬声器——HomePod后,这个情况即将发生重大变化。微软(Microsoft)也将加入这场竞赛,但它并非打造自家的扬声器,而是即将推出一款名为Invoke的Harman Kardon设备,由Cortana提供支持。今年初,进军该市场的另一重点是Lenovo的Smart Assistant扬声器,它将会是Amazon Alexa的新主人。使用者现在可以选择任何一款由Alexa智能语音服务提供支持、但不一定由Amazon制造的设备产品。Lenovo扬声器的音响系统也将由Harman Kardon支持。

中文智能扬声器为全球1/5人口敞开大门

同时,在中国,阿里巴巴(Alibaba)宣布推出天猫精灵(Tmall Genie) X1,正式进军智能家庭扬声器市场。

Tmall Genie X1It预计不久即将上市,价格大约75美元,比美国各种设备更便宜得多。不过,中国市场本身已经开始竞争了。阿里巴巴的竞争对手之一——在线零售业的后起之秀——京东商城(JD)与iFlytek合作,在去年发布玲珑叮咚系列智能扬声器。

中国搜索引擎巨擘——百度(Baidu)则与硬件公司AiNemo合作,在智能扬声器领域搭建略有不同的选择。这款称为Little Fish的设备是由百度的语音启动操作系统(OS)——DuerOS提供支持。它与迄今讨论的其他产品不同之处在于配备了屏幕和相机。智能机器人可以追踪使用者的脸部,并使用脸部辨识功能验证在线购物。它还可以显示信息和影像,以响应用户的查询。 20170914-audio-2 图2:百度推出配备屏幕和相机的智能扬声器,可以在房间周围对您进行追踪 (来源:Baidu)

这与Amazon Echo产品系列的最新产品Echo Show有点类似。但相对于Little Fish,Echo Show并不能移动,所以无法在房间周围进行追踪。您甚至也无法手动更改屏幕的角度,所以它的限制非常多,但这是美国第一款配备屏幕的智能扬声器。因此,当我们看到越来越多模仿原始Amazon Echo的产品出现时,Amazon本身正开始转向新功能。

技能组合是语音助理的差异化关键吗?

这个市场的竞赛还处于早期阶段,而产品彼此间的相似程度令人惊讶。除了些微的设计不同,设备的外观几乎没有任何差异,只有在内部出现一些更有趣的区别。麦克风的数量存在相当大的变化,从Google Home中只用了两支麦克风(执行远场语音提取的最小要求),到Lenovo Assistant支持高达8支麦克风。扬声器的数量和质量也不尽相同,在Lenovo和Apple即将推出的产品中,尝试透过多声道高音扩音器、室内校正和音频波束成形等技术,从而将音频提升到大幅超越Amazon和Google现有产品的水平。

扬声器背后的智能控制差异更为明显。人工智能(AI)平台在技能组合和可执行的任务方面并不完全相同。Alexa已经取得了15,000多种技能,远胜于任何竞争对手的产品。根据Voicebot的说法,Google Home排名第二,仅支持378种技能。就技能组合而言,未来可能会是一大卖点以及差异化的因素。

另一个重要方面是基础AI平台的“智能程度”。能够对话、理解语言的情境以及回答后续问题就是很好的例子。衡量这一点比计算技能更困难,但Google Assistant在这方面可能就超越Alexa了。一般来说,像Google和百度等搜寻巨擘可以取得大量的数据,在深度学习方面更有优势,这将有助于其日后的发展。

目前,AI平台和实体扬声器已经整合了,很快地就会发生变革。由于Amazon和Google已经向第三方设备开放其服务了,因此,扬声器硬件本身的设计对任何人都是开放的。只需藉由足以实现远场语音拾音功能的解决方案,任何设备都可以透过API连接到所选择的个人助理,并提供智能语音服务。这为芯片和设备制造商开启了大量的机会来建构智能扬声器硬件,以把握任何市场机遇。至于Apple,同样地,该公司仍将Siri保留在自家硬件中。

打造具成本效益的低功耗SoC方案

综合上述的所有要点,我认为这标志着第二波智能扬声器的冲击。在第二波周期,设备制造商使用相同的几种个人助理平台,致力于降低成本并实现大量市场。为此,他们必须在功能特性和用户体验之间找到最佳平衡,同时保持具竞争力的价格。此外,市场领导厂商将尝试提升平台的技能和智能程度,并推出新的特性功能(如屏幕和相机),以取得不同程度成功。就像十年前的智能手机平台战争一样,尽管导致许多变化,最终将融合于消费者的达尔文“适者生存”选择。

语音接口市场正蓬勃发展中,预计还有更多的公司加入。观察Lenovo扬声器和Invoke也将特别有趣,因为这象征着语音助理本身及其消费应用产品之间“分道扬镳”的开始。

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。