北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

新闻资讯NEWS

北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

灵云智能音箱语音交互解决方案 助力硬件厂商突围入口之战

 发布于:2017-06-14 15:37   浏览:

前不久,苹果在WWDC大会上推出的重量级产品HomePod可谓一石激起千层浪。采用6麦克风阵列技术实现远场语音识别,除了主打听觉音效,HomePod还可以语音控制智能家居,播报天气、新闻等信息。除了已经“燃战”的亚马逊Echo、谷歌Home,微软近期也发布了搭载Cortana的智能音箱,智能音箱可谓成了“巨头的标配”。

大战即起  完善解决方案备战

国外巨头纷纷布局智能音箱的背后,是将其打造成为智能家居的入口,成为类似手机中的Android系统一样的家庭智能化平台。国内市场虽显得不温不火,但趋势已定,入口大战已暗流涌动一触即发。

在实现智能音箱成为家居中控的过程中,能否拥有远场精准语音交互的解决方案成为极其关键的因素。亚马逊音箱在国外的畅销,很大程度上在于将语音交互突破了距离的限制,使用麦克风阵列及相应的语音识别技术,有效地将语音交互距离拓展到数米之外,从近讲到远讲,使得语音交互更加自然。

捷通华声推出灵云智能音箱语音交互解决方案 

作为在语音交互领域的深耕者,捷通华声针对智能音箱语音交互的需求提出了全套的解决方案,包括远场麦克风阵列产品、灵云语音助手(包含云+端语音识别、语义理解及语音合成功能)、灵云声纹识别产品,以及丰富的第三方接入内容,让智能音箱能够轻松实现远场语音交互,成为智能家居入口争夺战的一大利器。

同时,智能音箱开放者可在灵云商城购买环形6麦克风阵列开发板用于评估,也可在灵云平台下载使用灵云麦克风阵列SDK。

灵云麦克风阵列 精准远场语音识别

解决方案中,智能音箱的远场语音识别由灵云环形6麦克风阵列来实现。灵云麦克风阵列通过语音唤醒功能将音箱从休眠状态唤醒,利用360度声源定向,准确定位说话人方向,并通过语音降噪增强该方向的语音,抑制其他方向以及非人声的背景音,而回升消除可以清除音箱播放的声音,从而实现准确远场声音采集。

灵云语音助手 一语读懂你心

通过灵云麦克风阵列实现远场精准的声音采集之后,灵云语音助手可以帮助智能音箱实现像亚马逊Echo、苹果HomePod一样的自然人机语音交互。只需与智能音箱对话,音箱就能搜索播放音乐、有声读物、网络电台,播报天气、新闻,查询飞机航班、火车票,与其他设备互联之后,还能语音控制其他智能家居、家电。

目前,灵云平台能够提供丰富的第三方内容,例如天气、百科、音乐搜索等领域,还可以根据用户提出的需求,单独创建内容领域,也可以对接更多的第三方内容平台。

在语音交互的基础上,灵云声纹识别产品可以让智能音箱能够听过声音准确辨别使用者的身份,同时能够辨别性别、年龄等身份特征,从而让智能音箱根据不同的使用者提供个性化服务。

灵云智能音箱语音交互解决方案具有如下产品优势:

5米唤醒率 > 95%,误唤醒率 < 1次/24小时

环形布局阵列定向精度 < ±10°

3米识别率 > 95%,5米识别率 > 92%

灵云语音合成支持多种本地发音人,支持定制特殊音色发音人。

灵活的接入方式,可以适配多种芯片平台

高性能,低功耗芯片,符合待机功耗标准

技术支持到位,提供全套的原理图和Pcb图纸资料,专业的支持团队

产品合作方式灵活,既可以购买语音硬件,也可以购买软件授权

提供样品测试,测试通过后,确定商务合作模式,全程参与产品研发

在产品落地应用上,灵云语音交互方案已经应用于乐视、小米等众多电视、空调厂家产品中,灵云麦克阵列产品也在新松、棠棣、木爷等几十家服务型机器人中,以及长安众多智能车载产品中应用。

捷通华声通过推出性价比极高的软硬件语音交互方案,以及为开发者提供的灵云麦克风阵列SDK、灵云麦克风阵列开发板、灵云语音识别SDK、语音合成SDK、语义理解SDK 等等众多相关语音产品,旨在让每一家智能音箱厂商都能低成本快速拥有语音交互技术,极大地提升了产品的功能及用户体验,在智能家居入口争夺战中具备极强的竞争力,从而赢得入口之争。