【摘 要】
:
近年来,随着人工智能技术的不断发展,语音交互成为了最方便快捷的人机交互方式,智能音箱则逐渐成为人们日常主要的人机交互对象。语音交互质量的好坏是决定人机交互体验质量的关键,其中声学回声能够严重影响待识别语音指令的质量,从而降低语音唤醒与语音识别结果的判别。因此,智能音箱环境下的回声消除已成为人工智能领域的研究热点。论文主要的研究内容是针对传统声学回声消除算法对目标语音信号的失真性和复杂性等问题,提出
论文部分内容阅读
近年来,随着人工智能技术的不断发展,语音交互成为了最方便快捷的人机交互方式,智能音箱则逐渐成为人们日常主要的人机交互对象。语音交互质量的好坏是决定人机交互体验质量的关键,其中声学回声能够严重影响待识别语音指令的质量,从而降低语音唤醒与语音识别结果的判别。因此,智能音箱环境下的回声消除已成为人工智能领域的研究热点。论文主要的研究内容是针对传统声学回声消除算法对目标语音信号的失真性和复杂性等问题,提出基于智能音箱环境下回声消除算法,主要的研究内容如下:首先,论文在对回声消除基础理论与基本算法分析研究的基础上,详细阐述了几种传统的单通道回声消除算法,并介绍了回声消除性能评价准则。其次,考虑到智能音箱中声学回声消除算法复杂性与麦克风数量成正比,容易超过可用的计算资源,论文改进了相对回声传递函数的多通道回声估计算法,利用多通道间的空间结构来估计回声,从而使计算量减少。在此基础上,结合广义旁瓣抵消波束形成技术提出了麦克风阵列快速回声消除算法,以获得具有较高信源失真率和可懂度的目标语音信号。然后,针对智能音箱中回声消除鲁棒性差的问题,论文提出一种基于双向长短时记忆神经网络的联合去除回声和噪声的算法。该算法不再需要单独的双端检测器、噪声抑制器和残留回声抑制模块,有效避免了双端检测器检测不准确的问题,联合去除回声和噪声可以较好的保留原始语音信号的频域信息,提高了非线性回声和非平稳噪声的实际情况下语音可懂度。仿真实验结果进一步验证了该算法的有效性。最后,考虑到麦克风硬件拾音性能对于语音前端算法(如回声消除、声源定位、语音增强等)、语音唤醒与识别等核心功能模块也起着重要的作用,关乎智能音箱的交互质量,论文搭建了基于麦克风阵列的智能音箱拾音性能测试平台,提出了测试指标与测试算法。试验证明,该平台可以快速给出测试结论,提高了测试结果的准确性,并降低了测试的难度,为回声消除算法等后续算法提供了较好的硬件支撑。
其他文献
研究目的:探讨以颌面部颈部为始发部位的淋巴瘤的临床特征及预后情况,从而为其诊断与治疗提供依据。研究方法:回顾性分析2014年至2019年就诊于郑州大学第一附属医院口腔颌面
近年来,随着煤矿开采不断向数字化和智能化方向发展,为减少煤矿开采事故的发生率,将新技术应用到煤矿的安全生产领域就变成了关键。通风系统是煤矿开采作业的重要组成部分,传
卫星激光通信是使用光波段的卫星互联网电磁波代替传统微波的通信方式,具有通信容量大,安全性高,能量集中,天线体积小,发射功耗低的优点。在星地通信中,激光在大气内传输受到
在节能减排、洁净化用能形势驱使下,电力系统中电源、电网、用电构成格局将发生本质性变化。风光等可再生能源、清洁能源发电将逐步替代或遏制化石燃料电源发电,成为主导型电
本文简述了冶金运输企业安全管理的现状,分析了安全教育在安全生产管理中的重要作用,提出了做好安全教育的途径和形式方法。
研究目的:探讨涎腺分泌癌的临床表现及影像学特点研究方法:收集郑州大学第一附属医院2017年1月至2020年8月经病理诊断为涎腺分泌癌的患者9例,均发生于腮腺,对其发病年龄、性
随着中国改革开放的深入和中外交流的发展,来华学习汉语的留学生越来越多,在许多学汉语的留学生中渐渐出现了一些较为不同的学习者,那就是具有中华血统的华裔留学生。近年来,
铁路运输安全管理,就是按照铁路安全生产的客观规律,通过提高职工队伍素质,提高执行规章制度的自觉性,改善劳动条件,最有效地调动劳动安全生产的积极性,实现安全生产,达到杜
班组是煤矿安全生产最基层的组织,是落实煤矿井下安全工作的直接组织者。在推进煤矿安全发展、和谐发展的进程中有不可替代的作用。加强班组安全教育建设,是确保煤矿安全生产
安全教育是企业安全管理的基础工作之一,也是安全生产的重要保障,是提高职工安全文化素质的重要途径.通过安全教育提高职工的安全意识,掌握安全知识和技能,自觉遵章守纪,是杜