在美国生活的朋友应该都习惯了苹果的Siri和谷歌手机的语音助理,在家中也很多人在用Alexa的智能音箱系列设备。语音助理在美国这么流行,这跟英语系的语言识别做得好,也有人认为是英语系语言识别功能更容易做好,有很大关系。其实另一方面是美国人外出大多时候在开车,法律管得严,开车不敢碰手机。有了语音助理,来个语音拨号、语音导航什么的,一问一答式地解决问题,真的是太方便了。由于使用的人越多,在美国的语音识别功能变得更加智能、准确。智能音响等基于语音的控制技术的产品就会越来越受欢迎,也越来越多。

在中国呢?我们知道讯飞、思必驰(aispeech)、云知声等公司,都已经在汉语的语音识别上做得非常不错。这些公司跟国内的芯片厂商例如RDA和全志等都有紧密的合作,并推出了基于这些公司的智能音响。叮咚(DingDong)则通过语音实现对智能家居产品的控制,用户通过手机APP设置相应场景模式,一键实现对电视、洗衣机、空调、净化器、窗帘、热水器以及油烟机等进行操作,非常简单。 20170707-baidu-dueros-1 图:JD上关于叮咚音箱的功能介绍

20170707-baidu-dueros-2 图:JD上关于叮咚音箱的声音硬件说明

目前叮咚音箱已经推出A1\A1x\A3、Q1\Q3和叮咚TOP等系列产品,销量在京东遥遥领先。在国内叮咚音响也被公认为是做得最好的一个类似于国外智能音箱的产品。全志科技的营销副总裁李智曾表示,在看到国外智能音响成功之后,国内有一大波在做智能音响的方案公司都在做研发。这将会是一个风口。”

李智认为,对于中国来讲,智能音箱可能还得两年的生长期,第一数据的积累,第二业务的完善,第三云端服务部署的完成,得需要这样一个过程。所以长久来讲,就是智能家电、智能语音,包括智能音响,他都是不同的产品形态。那么对于智能化大潮来讲作为单模式态的语音功能,它肯定是一个非常强的入口。

不过,事情可能会比李智认为的还会要更快。在7月5日的“2017百度AI开发者大会”上,百度宣布了DuerOS开放平台,可以支持基于语音和图像识别的智能产品开发。

20170707-baidu-dueros-3 图:百度度秘事业部总经理景鲲在发布会上展示开发套件

百度度秘事业部总经理景鲲在会上宣布了DuerOS会支持包括智能音箱、智能家电的语音控制。“听清、听懂和满足是语音智能识别的三大要素。”

听清要达到97%以上的准确率,包括麦克风阵列、回声消除、波速成形、语音唤醒和远场识别等远场语音技术。听懂是AI时代的核心问题,只有解决了听懂,才能让用户与设备之间进行自由的交流。

景鲲在会场宣布百度将全资收购专注语音唤醒和自然语音交互技术的KITT.AI公司。KITT.AI世界上唯一一家获得亚马逊Alexa和微软联合创始人Paul Allen投资的公司,并入选了CB Insights人工智能创业一百强。KITT.AI联合创始人、CTO陈果果现在演示了如何使用KITT.AI语音唤醒技术快速打造一个语音唤醒设备。

DuerOS智能设备开放平台是DuerOS为企业级用户提供解决方案的开放平台。平台当前为用户提供:智能音箱、智能TV、智能冰箱、语音助手、智慧芯片等解决方案。企业用户可以在完成开发者认证后,通过平台来申请获取DCS SDK、芯片模组、麦克风阵列等devkit能力。

DuerOS在硬件上目前跟科胜讯、英特尔、MTK、Rockchip、全志、RDA、Realtek、高通等公司合作推出不同的开发套件。

在百度发布DuerOS和有关开发套件后,更多的硬件厂商都加入到了智能音箱和智能家电的开发与推广。电子工程专辑主分析师张迎辉认为,随着语音识别的准确率不断提升,基于大数据的搜索引擎优化、语音识别的深度学习以及基于中文与汉语的智能语音硬件设备开发不断加强,智能语音识别设备,即将迎来一个更高速的发展高峰。 DuerOS的相关阅读:

DuerOS智能硬件开发套件标准版是一款基于MTK平台MT8516处理器和科胜讯四麦克风阵列的语音整体解决方案。开发平台为用户提供了强大的处理性能和调试资源,形成完整的软硬一体语音解决方案,用户可以方便地使用、体验DuerOS丰富的生态资源。

DuerOS智能硬件开发套件个人版为远场语音交互解决方案,与树莓派3B完美结合,采用2颗高灵敏度MEMS麦克风,360度方向高效拾音,搭载百度DuerOS SDK,为用户提供百度海量的信息服务能力,降低开发难度并满足用户在不同智能场景下的个性化需求。

本文为《电子工程专辑》原创,版权所有,转载请注明出处并附链接

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。