论文部分内容阅读
作为新生产业,智能家居目前处于一个导入期与成长期的临界点,有关研究机构预计,全球智能家居设备增速将超过智能手机和平板市场,在2019年将达到4900亿美元,对范围更大的智能化应用来说,这仅仅是繁荣的开始:智能化应用不仅仅是智能家居、还包括智能操作系统、智能模块等周边配套产品及智能解决方案,而这一方向显然跟智能家居有着同样闪耀的未来。
在年初的上海家博会上,我们就京东推出的JD 、云平台,之后又推出超级APP并成立了智能集团,全面布局打造健康的智能生态圈,虽然没有太多实物,但我们看到了京东大力进军此行业的决心。此次展现在我们眼前的京东DingDong智能音箱由科大讯飞和京东双方合资的北京灵隆科技有限公司出品,是其第一款标志产品,定位于全新智能交互体验入口,可以通过语音控制代替传统按键/触屏控制,将通过远场语音控制彻底解放双手。
智能背后的顶尖声学技术
DingDong智能音箱定位于语音智能入口,其口号是“能听会说,响你所想”。然而,想要实现“零触控”的语音控制,现实中的挑战很多。比如播放音乐或电台节目情况下能否识别语音指令?有噪音背景下能否准确识别?用户使用距离可近可远,如何保证效果?首先,播放节目状态下如何识别语音指令?高品质音箱音量可达100dB以上,人声一般仅仅是30dB-50dB。DingDong智能音箱采取了国际顶尖的回声消除(Acoustic Echo Cancellation)技术,保证了音箱大音量时的高唤醒率。
其次,DingDong智能音箱的回声消除技术体系包括四大核心模块:超低信噪比回声消除、多通道回声消除、非线性回声消除和麦克风阵列回声消除。超低信噪比回声消除技术解决了由于音箱喇叭比用户距离麦克风更近造成信噪比差异而产生的回声问题;多通道回声消除技术解决了由于各通道音频内容不同而产生的回声;非线性回声消除技术解决了因喇叭的振动对麦克风产生的回声;麦克风阵列回声消除技术利用麦克风阵列降噪技术,将喇叭作为噪声进行抑制,在此基础再进行回声消除。
然后,在噪音环境下如何准确识别用户指令?DingDong智能音箱采用了基于麦克风阵列 语音唤醒的目标信号检测技术,实现了谁唤醒谁使用,目的明确且交互过程抗干扰能力强。其技术原理是,通过麦克风阵列划分空间波束区域,提取波束区域内语音信号,选择能量大的波束送入语音唤醒引擎,语音唤醒得分最高波束即为说话人方向,从而实现更精确的声源定位。
最后,是如何解决用户使用距离或远或近的问题。DingDong智能音箱可谓软硬兼施,在硬件上采用了高灵敏度的麦克风抗震结构和声波能量平衡设计,应对语音信号的传播衰减;在软件上,采用了麦克风阵列的波束形成技术和麦克风阵列去混响技术,应对语音传播过程的噪声,5米距离语音听写识别率突破90%。
全新智能交互体验入口
作为一款音箱产品,京东为什么会在语音识别技术上大做文章呢?答案是,DingDong智能音箱更多的是肩负着家庭智能语音控制中心的任务出现的。它可以通过京东微联平台实现对智能设备的统一管理控制、跨品牌跨品类的互联互通、大数据的集中管理,将多款智能产品真正连接起来打造适合各种应用场景的智能生活解决方案,为用户提供全新的智慧生活体验。目前,京东旗下完成对接的微联产品已经超过500款,正在对接的产品达到上千款,销量已经达到百万件。预计在2015年内,京东接入微联的产品件数还将达到千万级。
DingDong智能音箱内建Wi-Fi模块,可以自由调用包括英语、天气、新闻、电台等多种互联网信息资源,同时也可以设定自己的喜好让音箱自己来匹配相关信息进行播报。此外,它还可以通过Wi-Fi局域网控制同一网段下的其他智能设备。如,我们可以通过语音与音箱进行对话,来控制智能电器的开关(电灯、空调、微波炉等),甚至,我们还可以进行一些更具体的调整,如空调设定多少度,制冷还是制热的模式等等。
近年来,京东不断完善智能生态体系建设,已经形成了从智能创业孵化、技术平台支持、产业链整合、金融投资助力到渠道推动的完整智能生态布局。京东智能打造的投资孵化能力、工业设计和UI能力、供应链能力、互联网互通能力、智能云和大数据能力、整合营销能力正在全面助力智能产业发展。
在年初的上海家博会上,我们就京东推出的JD 、云平台,之后又推出超级APP并成立了智能集团,全面布局打造健康的智能生态圈,虽然没有太多实物,但我们看到了京东大力进军此行业的决心。此次展现在我们眼前的京东DingDong智能音箱由科大讯飞和京东双方合资的北京灵隆科技有限公司出品,是其第一款标志产品,定位于全新智能交互体验入口,可以通过语音控制代替传统按键/触屏控制,将通过远场语音控制彻底解放双手。
智能背后的顶尖声学技术
DingDong智能音箱定位于语音智能入口,其口号是“能听会说,响你所想”。然而,想要实现“零触控”的语音控制,现实中的挑战很多。比如播放音乐或电台节目情况下能否识别语音指令?有噪音背景下能否准确识别?用户使用距离可近可远,如何保证效果?首先,播放节目状态下如何识别语音指令?高品质音箱音量可达100dB以上,人声一般仅仅是30dB-50dB。DingDong智能音箱采取了国际顶尖的回声消除(Acoustic Echo Cancellation)技术,保证了音箱大音量时的高唤醒率。
其次,DingDong智能音箱的回声消除技术体系包括四大核心模块:超低信噪比回声消除、多通道回声消除、非线性回声消除和麦克风阵列回声消除。超低信噪比回声消除技术解决了由于音箱喇叭比用户距离麦克风更近造成信噪比差异而产生的回声问题;多通道回声消除技术解决了由于各通道音频内容不同而产生的回声;非线性回声消除技术解决了因喇叭的振动对麦克风产生的回声;麦克风阵列回声消除技术利用麦克风阵列降噪技术,将喇叭作为噪声进行抑制,在此基础再进行回声消除。
然后,在噪音环境下如何准确识别用户指令?DingDong智能音箱采用了基于麦克风阵列 语音唤醒的目标信号检测技术,实现了谁唤醒谁使用,目的明确且交互过程抗干扰能力强。其技术原理是,通过麦克风阵列划分空间波束区域,提取波束区域内语音信号,选择能量大的波束送入语音唤醒引擎,语音唤醒得分最高波束即为说话人方向,从而实现更精确的声源定位。
最后,是如何解决用户使用距离或远或近的问题。DingDong智能音箱可谓软硬兼施,在硬件上采用了高灵敏度的麦克风抗震结构和声波能量平衡设计,应对语音信号的传播衰减;在软件上,采用了麦克风阵列的波束形成技术和麦克风阵列去混响技术,应对语音传播过程的噪声,5米距离语音听写识别率突破90%。
全新智能交互体验入口
作为一款音箱产品,京东为什么会在语音识别技术上大做文章呢?答案是,DingDong智能音箱更多的是肩负着家庭智能语音控制中心的任务出现的。它可以通过京东微联平台实现对智能设备的统一管理控制、跨品牌跨品类的互联互通、大数据的集中管理,将多款智能产品真正连接起来打造适合各种应用场景的智能生活解决方案,为用户提供全新的智慧生活体验。目前,京东旗下完成对接的微联产品已经超过500款,正在对接的产品达到上千款,销量已经达到百万件。预计在2015年内,京东接入微联的产品件数还将达到千万级。
DingDong智能音箱内建Wi-Fi模块,可以自由调用包括英语、天气、新闻、电台等多种互联网信息资源,同时也可以设定自己的喜好让音箱自己来匹配相关信息进行播报。此外,它还可以通过Wi-Fi局域网控制同一网段下的其他智能设备。如,我们可以通过语音与音箱进行对话,来控制智能电器的开关(电灯、空调、微波炉等),甚至,我们还可以进行一些更具体的调整,如空调设定多少度,制冷还是制热的模式等等。
近年来,京东不断完善智能生态体系建设,已经形成了从智能创业孵化、技术平台支持、产业链整合、金融投资助力到渠道推动的完整智能生态布局。京东智能打造的投资孵化能力、工业设计和UI能力、供应链能力、互联网互通能力、智能云和大数据能力、整合营销能力正在全面助力智能产业发展。