麦克风网络中基于分布式卡尔曼滤波的说话人跟踪方法研究

来源 :大连理工大学 | 被引量 : 2次 | 上传用户:Zoeyha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于麦克风阵列的说话人定位与跟踪技术在音/视频会议系统、公共安全监控系统、语音识别、车载电话、机器人等领域得到广泛应用。近年来,随着无线传感器网络和集成电路技术的发展以及嵌入式处理器计算能力的显著提高,基于麦克风阵列网络的分布式说话人定位与跟踪技术成为语音信号处理领域的研究热点。采用分布式数据处理方式,分布式说话人定位方法不限制麦克风阵列网络的拓扑结构,其容错能力较强,可靠性和稳定性高,但它只利用当前帧的语音信号对声源进行定位,对背景噪声和房间混响鲁棒性较差。因此,需要采用分布式说话人跟踪方法来确定说话人的运动轨迹,以获得更好的声源位置估计性能。分布式说话人跟踪是典型的非线性状态估计问题。本文针对分布式麦克风网络提出了几种分布式非线性卡尔曼滤波算法,并将这些算法用于麦克风阵列网络的说话人跟踪问题,提出了几种分布式声源跟踪方法,实现对说话人运动轨迹的有效估计。本文的主要贡献如下:(1)针对分布式声源定位方法对背景噪声和房间混响鲁棒性差的问题,提出了一种基于分布式麦克风阵列网络的分布式卡尔曼滤波说话人跟踪方法。该方法考虑到噪声和混响影响使得时间延迟估计可能存在虚假值,引入了一种时延甄别策略,并在对声源进行跟踪时,从邻域搜集有效的时延估计作为观测信息,用郎之万模型描述说话人运动状态,然后用分布式卡尔曼滤波对说话人位置进行准确估计。该方法充分利用当前和过去时间帧的语音信号,能够有效解决分布式说话人定位的鲁棒性差问题,具有通信负担小、可靠性和稳定性高、使用灵活等优点。(2)针对说话人跟踪中观测模型的非线性问题,提出了一种分布式无味卡尔曼滤波方法,其可达到二阶估计精度。在此基础上,为充分描述室内环境说话人不同运动模式,引入交互式多模型算法,提出了一种基于麦克风阵列网络的分布式交互多模型无味卡尔曼滤波说话人跟踪方法。该方法对声源进行跟踪时,从邻域搜集有效的时延估计,并用不同模型描述说话人驻足、慢走、快走及加速等运动模式,然后融合不同模型的无味卡尔曼滤波结果,因此能够有效提高说话人位置的估计精度。(3)针对声源跟踪时说话人的初始状态可能未知或误差较大问题,提出了一种分布式迭代拓展卡尔曼滤波方法,并将该方法用于麦克风阵列网络的说话人跟踪问题中。此外,还引入一种迭代终止策略,使迭代过程始终向似然增加的方向进行,从而获得最大似然意义下的近似最优解。该方法在跟踪过程中,通过增加几次简单的局部迭代,即使当说话人的初始位置误差较大时,也能够快速捕捉到说话人的位置,因此具有更快的收敛速度,也能有效提高说话人位置的估计精度。(4)考虑到求容积卡尔曼滤波估计精度高,迭代拓展卡尔曼滤波收敛速度快的优点,提出了一种迭代求容积卡尔曼滤波方法,可达二阶估计精度。在此基础上,提出了一种分布式迭代求容积卡尔曼滤波方法,并将该方法用于麦克风阵列网络的说话人跟踪问题中。该方法具有二阶估计精度,且计算量较小,收敛速度快,能够有效求解说话人跟踪中观测模型的非线性问题,提高说话人跟踪性能。
其他文献
企业并购在当今市场经济中屡见不鲜,已经成为市场经济的主要竞争和合作手段,它关乎一个企业的生存和日后发展,但与此同时也存在着企业并购的财务风险。那么,时别企业并购中的
对于以应用性、职业性为主的高等职业教育来说,传统的教育体系已明显不适应企业用人需要,不利于以就业为导向,以能力为本位的现代职业教育理念和培养技能型人才目标的实现。本文
自从1961年加加林进入太空以来.载人航天已经走过近50年的历程。结过近半个世纪的载人航行.人类已经在太空飞行对人体的影响方面积累了大量的资料和经验。目前.人类又期望在21世
刘海洋'伤熊'事件发生后,人们纷纷谴责其不道德的行为,探讨用什么样的法律条款对刘海洋进行惩罚.而今,事件虽已过去,由此引发的沸沸扬扬的议论也已渐渐平息.但我们重
针对园艺专业的特点,以培养学生能力开口综合素质为目标,改革园艺专业教学实习和毕业实习等实践性教学环节,培养学生学农、爱农的思想观念,完善本专业实践教学体系。
本文介绍了汽车ADAS试验用自动驾驶机器人的结构组成,由基站、GPS/惯性导航系统、油门制动踏板执行机构、转向执行机构、控制器等组成,解释了机构中每个构件的作用,为ADAS试
D-S证据理论作为一种不确定信息融合技术,被广泛应用于信息融合的各个领域。但是在证据高度冲突情况下常常会导致错误的融合结果,研究人员对证据理论的组合规则的改进和数据
阐述了网络时代系级资料室建设的重要性,提出了系级资料室建设所面临的问题并对这些问题进行了探索研究。