基于麦克风阵列的语音增强和分离方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:lyfqxx3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
环境噪声和竞争说话者的干扰是语音通信过程中常见的干扰情况。人的听觉系统可以在嘈杂的多个讲话者的环境中区分和跟踪自己感兴趣的语音信号,并分辨出自己所需要的声音,这种分辨能力是人体内部语音理解机理所特有的一种感知能力,也就是人类的语音分离的能力,称为“鸡尾酒会效应”。然而,现有的语音处理系统无法做到这一点,其性能受到噪声和竞争说话者语音的严重影响。例如,当前的语音识别系统对纯净语音能够达到很高的识别率,但是当语音被噪声污染时,系统性能会急剧下降。语音信号增强和分离是抑制噪声干扰、还原原始语音信号的一种有效途径。近年来,基于麦克风阵列的语音增强技术在车载通信、多媒体会议以及机器人控制系统中得到广泛的应用。和单个麦克风相比,麦克风阵列在时频域的基础上增加了一个空间域,对来自空间不同方位的信号进行空时频联合处理。因此,麦克风阵列可以弥补单个孤立的麦克风在噪声处理、声源定位跟踪、语音提取分离等方面的不足,能够广泛应用于各种具有嘈杂背景的语音通信环境(如会场、多媒体教室、助听器、车载免提电话、战场等),以提高语音通信质量。麦克风阵列研究是阵列信号处理的新方向,具有广阔的市场应用前景。盲信号分离,是指在不知源信号和传输信道参数的情况下,根据输入源信号的统计特性,仅由观测信号恢复出各个源信号的过程,它是实现语音分离的主流方法。独立分量分析(Independent Component Analysis,ICA),是在研究盲源分离过程中出现的一种新兴的盲分离技术,自其出现便成为信号处理、数值分析、统计及神经网络等领域中的热点研究问题,并在语音处理、生物医学信号处理、模式识别、特征提取、数据压缩、图像处理和电子通讯等方面获得了非常广泛的应用。到目前为止已经有诸多语音增强方法被提出,但是强噪环境下的语音增强仍是一个具有挑战性的课题;另外,卷积盲分离的研究对于语音分离的实际应用具有重大意义,频域盲分离是解卷积的行之有效的方法,然而顺序不确定性成为一个严重的问题。本论文重点对以上两个问题进行研究和探索。本论文对ICA的基本理论、麦克风阵列语音增强技术和卷积混叠语音信号的盲分离进行了详细介绍;对麦克风阵列信号处理技术在语音信号处理中的应用进行了分析和探讨,并针对当前语音增强和分离的研究现状,对强噪环境下基于麦克风阵列的语音增强和频域内盲反卷积的顺序不确定性问题进行了研究和探索。主要进行了以下解决方案的研究:1.提出了基于ICA的麦克风阵列语音增强方法。方案中,我们首先利用ICA对严重污染的语音信号进行分析,提取出相对纯净的目标信号;然后通过后续的麦克风阵列语音增强系统(如维纳后滤波,GSC等),得到最后的增强信号。真实环境下的实验证明了该方法的有效性。2.提出了一种利用麦克风嵌套子阵列纠正频域反卷积的顺序模糊问题的方法。频域盲分离的顺序不确定性是一个严重的问题,如果顺序模糊不能得到正确的纠正,将导致算法性能下降,甚至解卷积失败。这里提出一种利用麦克风嵌套子阵列,结合DOA法和相关法纠正顺序模糊的方案。该方法能够得到更多的高可信度的DOA估计,在低频尤其如此;然后利用相关法对其余的频率点进行顺序调整。实验证明提出的方案具有较高的稳健性。应该指出的是,语音增强和卷积信号的频域盲分离研究中仍然存在着许多尚未解决的问题。论文最后对本课题的研究进行了总结和展望。
其他文献
随着制造企业信息化程度的提高,制造企业内部数字资源的不断增多,信息急剧膨胀,企业资源信息分散。制造企业内容管理系统是利用计算机和网络技术,将企业资源(包括制造资源、人力资源、技术资源等等)信息进行组织、分类、管理、存储、发布和搜索等服务活动,将这些分散、混乱的数据和信息整合为有组织的内容,以最底的成本共享和利用企业的资源信息,向客户和合作伙伴提供产品服务信息,推动企业走进电子商务。本文的主要研究工
提要地籍信息系统是在计算机软硬件支撑下,针对地籍管理的需要而设计的空间与统计数据管理系统。它具有数据采集,空间数据与统计数据的查询与更新、面积计算、图形绘制、报表输出等功能。本文对地籍信息系统中有关地块的合并与分割的方法进行了深入的研究,给出了一种适合计算机处理又能满足实际需要的方法。  中图分类号:P27文献标识码: A 文章编号:  现代地籍管理有别于早期地籍管理的一个重要标志是以计算机为核心
期刊
随着数字技术、信息技术和网络技术的迅猛发展,数字视频广播技术在全球迅速蔓延。近年来,电视数字化的进程明显加快,模拟信号向数字信号过渡全面展开,手机电视技术表现出来了
【摘要】我国高职教育经过二十多年的发展,对于完善高等教育结构体系,促进高等教育的大众化起到了重要作用。但高职教育在发展过程中还有许多不尽如人意的地方,正确分析高职教育的现状和问题,是高职教育实现科学发展的前提。  【关键词】高职教育教学改革  Abstract: Higher vocational education in China plays very important role in co
期刊
在图像成像、复制、扫描、传输、显示等过程中,不可避免地要造成图像的退化,而在许多应用领域中,需要清晰的、高质量的图像,因此,图像恢复具有重要的意义。图像恢复目的是对
在制造业全球化和网络化环境下,如何更好地利用全球制造资源,实现协同制造是制造企业提高竞争力的重要手段之一。由于制造网格中包含各种各样的具有动态性、多样性、自治性、
最新的视频编码标准H.264在具有优良的编码效率的同时,加入了很多误码恢复工具,例如片模式,参数集,数据分割等等,提高了抗误码特性。前向纠错码LDPC具有低译码复杂度,可线性时间编
全光场相机是一种基于光场成像的新型成像系统,它通过在主透镜与传感器之间加入微透镜阵列来获取场景的四维光场,即二维空间信息和二维角度信息,具有其它传统相机无法相比的
电子商务、电子政务及网络的普及使得信息安全变得越来越重要,同时,由于Web的广泛性和易用性等原因,基于Web的应用成为网络应用中最具有代表性的一个方面,为Web应用系统的提
1.前言  新型混凝土横孔连锁空心砌块(如图1.1)新研发的一种新型墙体材料,它弥补了目前国内外采用的竖孔空心砌块的不足。干砌的填充墙体内部方便布置横向管线,并可在墙体内布置水平横向钢筋混凝土带,墙体刚度大,整体性好。采用新型混凝土横孔连锁空心砌块干砌的填充墙体,符合国家墙体改革的宗旨和要求,更具有干砌、防渗、轻质、抗裂、节地、节材、保温、隔热、节能、环保等多种优点,克服工程建设通病、提高工程质量
期刊