室内麦克风阵列声源定位算法研究和实现

被引量 : 0次 | 上传用户:liuyingbo1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的进一步发展,语音在接收和处理信息方面的应用重要性得到了广泛的关注,语音识别,语音增强,目标声源的定位等应用方兴未艾,而声源的定位是实现语音增强,语音识别的前提和基础,基于麦克风阵列的声源定位技术由于其广阔的应用前景得到了广泛的关注。在本论文中,我们致力于研究室内环境下的基于麦克风阵列的声源定位系统的研究和实现工作。在室内环境中,由于房间回响和背景的噪声的影响,麦克风阵列的性能受到了极大的限制,再者,由于硬件条件的限制,一些定位算法所需的计算量大,限制了其实时的应用。本文针对上述的两个问题,提出了自己的解决方案,并在实际环境中搭建了系统,采集了数据,验证了提出算法的有效性。鉴于预处理和语音活动检测对声源定位系统后续处理的重要性,首先我们介绍了滤波,加窗预处理操作,解释了简单但有效的语音活动检测算法:能量法和过零率法。基于时间到达差的(TDOA)的GCC-LMS两步定位方法由于其计算量小,因此在实际的系统中得到了广泛的应用。第一步的时延估计直接决定了定位的性能,我们在实际中发现,由于采集卡同步噪声的原因,虚假的零峰值导致了错误的时延估计,因此,我们对互功率谱滤波解决此问题。为了尽可能的削弱回响和噪声对时延估计的影响,我们采取了几个措施,1)减小搜索空间,按照麦克风的距离设置搜索区间,2)根据信噪比动态的调整权重函数的大小,仿真结果表明了这些措施的采用提高了在高噪声和回响环境中时延估计的准确度。另外,我们针对了采样率低的情况提出了对互相关函数的插值,提高了时延估计的空间分辨率。在TDOA的第二步中,目前广泛采用了最小二乘法(LMS),为了增强系统的可靠和稳健性,我们提出了一种轮流使用麦克风为参考麦克风,剔除误差较大的位置估计,对剩下的取平均,提高了位置估计的鲁棒性。另外,我们介绍了基于双曲线定位的平面几何法,并和最小二乘法(LMS)做了简要的对比。目前另一种广泛使用的声源定位方法是可控波束法(SRP),一步定位的可控波束法相对与两步定位的TDOA法,推迟了做决策的阶段,综合了所有的麦克风信息,具有更强的抗回响和噪声能力,而与之相随的代价是计算量大,难于实时处理。基于随机区域收缩(SRP-SRC)的可控波束法避免了全局的空间搜索,极大的减少了计算量,在论文中,我们改进了SRP-SRC方法,称之为SRP-RSRC方法,1)引入了塑形函数,提高了能量峰值和周围环境的对比度,2)设定一能量阈值,从能量大于此阈值的空间中选择能量最大的点,使SRP-RSRC算法具有更快的收敛速度,更小的计算量。另外,我们将卡尔曼滤波和预测和SRP-RSRC联合使用,使系统的跟踪性能更为稳定。最后,我们介绍了我们在室内环境中实现的系统的基本结构和软硬件的情况,并用实际中采集的数据对基于TDOA的两步GCC-LMS定位法和SRP-SRC,SRP-RSRC做了对比分析。
其他文献
中暑(又称日射病和热射病)为各种动物的夏季易发病。夏季由于日光的直接照射或长时间处在闷热潮湿、通风不良的环境中,动物体温调节中枢会发生失调。临床上中暑动物表现出兴奋不
农村留守儿童的学前教育存在经费严重匮乏、幼儿园数量严重不足、幼教师资水平差、家庭教育严重缺失、幼小衔接困难等问题。农村留守儿童的学前教育是关系国家未来的事业,需
在"分税制"和"农村税费改革"不断深入的背景下,乡镇财政管理模式已不能适应新的形势和发展要求,"乡财县管"是在乡镇这一级财政管理方式的创新,大体能适应乡镇的现实情况,体现
第一部分伴有非瓣膜病性心房颤动、CHA2DS2-VASc评分≤1分,且未接受抗凝治疗的肥厚型心肌病患者发生缺血性脑卒中和系统性栓塞的风险研究背景及研究目的:目前,尚缺乏有关伴有
道路交通安全问题是世界上所有国家面临的难题。我国的交通安全形势与其它国家相比更为严重。交通系统是一个人、车、路、环境构成的复杂动态系统,系统处于平衡状态时,没有事
多层片式EMI滤波器是一种基于低温共烧铁氧体技术(LTCF)的新型滤波器,应用于电磁兼容领域,具有小型化、轻便化和宽频带特点,在通信、汽车、数字化家电等产品中已得到广泛应用
管理伦理化是高校管理现代化发展的必然趋势,在构建和谐社会、和谐校园的视阈下,高校管理作为社会生活的特殊管理领域,美德和善行是高校管理干部道德之应然取向。"仁爱"、"良
随着我国现代性向民族社区持续嵌入,民族社区文化传统传承程式"骤然"消解,呈日趋式微之势。民族社区学校成为民族文化传承前沿阵地,然而因其触及"学校教育竞争",实践步履维艰
如何有效地对非结构化全文数据进行处理是数据集成领域中研究的热点和难点问题。本文从两个方面对这个问题进行了研究:我们提出了一种基于语义的通用数据集成模型——本体-树
Halliday的系统功能语言学中语篇的三个纯理功能之一的语篇功能,是由主位结构、信息结构和衔接系统协同完成,从语篇功能的主位系统出发,选取了10篇英文年报中两个主要板块之一的