北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

新闻资讯NEWS

北京捷通华声科技股份有限公司——全方位人工智能技术与服务提供商

人机语音交互 | 灵云麦克风阵列声卡,给机器人赋予灵敏双耳

 发布于:2017-10-10 20:29   浏览:

前几天,谷歌发布的GoogleHomeMini/Max智能音箱,均内置麦克风阵列技术,以实现远距离的语音交互。在人与机器人、空调、车载等设备的语音交互场景中,通过麦克风阵列技术处理声学信号,为语音识别引擎提供高质量的声音,已成为物联网设备语音交互的必需。

 

通过在机器人领域的产业应用与技术积累,近期,捷通华声推出一款适用于机器人的声卡——灵云麦克风阵列声卡。该声卡具备回声消除、实时定向增强、实时降噪等功能,可高效处理机器人所在的大厅、窗口、家庭等场景中的环境噪音,进行远距离定向人声拾取,输出高质量的声音信号,提升机器人在应用环境中的语音识别率。

在机器人语音交互场景中,灵云麦克风阵列声卡通过如下方法来处理声学信号:

  • 消除机器人自己说的话

    通过一路声音信号的输入作为消回声参考信号,把来自麦克中的此声音信号滤除,同时可实现语音打断功能;

  • 消除环境噪音

    根据声音频谱段,去掉环境噪音,提取有效人声,以提升语音识别的准确率;

  • 实时定向增强说话人声音

    通过各个麦克风对接收到的声音相位差,计算得出声源(说话人)位置,并实时指向性接收某一个方向(说话人)的声音,抑制其他方向的声音。

     

(90度方向语音增强,点击放大查看图片)

相比传统声卡,灵云麦克风阵列声卡声音信号处理能力优越,功耗更低、即插即用,且成本约为市场上同类产品的一半,已成功应用于新松、木爷等大厅服务机器人,阿U兔、派宝等家庭服务机器人,累计出货量近万套。

灵云麦克风阵列声卡已上线灵云商城(shop.aicloud.com),个人开发者和企业开发商可上线灵云商城购买使用。同时,灵云平台提供包括麦克风阵列软硬件、语音识别、语义理解、语音合成以及客服云服务等全面的语音交互SDK与云服务,助力个人开发者和企业开发商快速打造具备语音交互功能的智能硬件。