欠定混叠语音信号盲分离方法的研究

来源 :河南科技大学 | 被引量 : 0次 | 上传用户:fanjie51
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音分离作为语音信号处理的重要研究方向,在语音识别、语音增强等方面都有着非常积极的意义。本论文在分析和总结以往研究工作的基础上,针对欠定语音分离的难点问题(传统算法对信号稀疏性要求高、含噪分离难和分离精度低)进行研究,有效的将欠定情况下的语音盲分离应用于含噪,信号稀疏程度不够的场景下。主要成果如下:1.针对传统稀疏算法分离欠定情况精度低的问题,提出了基于直线隶属度函数算法。语音分离过程中关键的一步为混合矩阵的求解。本算法在求解混叠矩阵时利用混合信号的线性聚类特性,通过混合信号向量构造直线隶属度函数。该函数基于向量角度衡量数据隶属于到该函数所代表直线的程度。通过对该函数极值的求解来获取数据所聚类的直线,从而求解出混叠矩阵。最后通过语音信号分离实验验证,较之势函数法,该算法在欠定情况下分离出的信号的信噪比平均提高5db。2.针对传统算法在含噪语音分离精度低的问题,提出了噪声影响因子方法。依据噪声对信号数据影响的情况,提出噪声影响因子概念,对数据加以区分。在求解混叠矩阵时,加强噪声影响因子低的数据的权重,降低噪声影响因子高的数据的权重。最后通过实验验证,在含噪情况下,结合噪声影响因子后的直线隶属度函数法分离出的信号的信噪比平均提高4db。3.针对传统稀疏算法对信号的稀疏程度要求高的缺点,提出基于超平面隶属度函数的欠定盲分离算法。2005年提出的K-SCA假设较之SCA(sparse component analysis)假设,其稀疏性要求明显降低。K-SCA假设将混叠矩阵的求解转化为混合信号向量点所聚类的超平面的法向量的求解。本文在K-SCA假设的基础上提出超平面隶属度函数求解算法。该函数基于数据向量与函数变量的夹角来衡量数据向量隶属于以函数变量为法向量的过原点超平面的程度。通过对函数极值的求解来获取数据聚类的超平面,从而求解出混叠矩阵。最后通过实验验证了算法可有效的应用于信号稀疏程度不够的情况下,分离出的信号具有较高的信噪比。
其他文献
随着社会经济的发展,机动车辆与日俱增,随之而来的驾驶安全问题受到越来越多的关注与重视。统计表明,在所有的交通事故中,10%-20%是由于疲劳驾驶造成的。因此驾驶员疲劳检测成为了
印刷行业面临着日趋激烈的竞争,客户对印刷品质量的要求也越来越高,而印前数据处理的优劣在很大程度上决定着印刷品的质量。在如今的印刷品中,图像占据了越来越重要的地位,由
粒计算是一门快速发展的新兴学科,它主要思想:把复杂信息按照特征和用户需要划分为若干较为简单的块,每个块称为一个信息粒,划分粒的过程称为信息粒化。它以模糊逻辑、粗糙集和商
数字印刷是印刷技术发展的重要方向,数字印刷的一个重要特征是每张印品上的图文数据是可变的,因此数字印刷要求极高的数据传输速率,当前主流硬盘带宽无法满足数字印刷对传输
基于视频的人体运动姿态跟踪是计算机视觉领域一个重要的研究课题,其广阔的应用前景对推动虚拟现实、人机交互、智能监控、医疗以及其他领域的发展有重要的研究意义。人体运
基于J2EE平台的轻量级开发框架消除了一些传统开发中多余的复杂性和技术方面的约束,业界应用十分广泛,但仍然采取效率低下的手工方式的模型转换,所以需要建立一套可行的系统
随着数码设备的普及和互联网的快速发展,网络资源环境下的图像资源越来越丰富。如何从海量的web图像资源中检索用户感兴趣的图像成为信息检索领域的热点问题。近年来,基于概念
随着科技的进步,观测手段,实验工具的巨大革新,导致的数据的爆发式膨胀,科学研究方法从过去的经验科学阶段转变到以数据处理,分析,挖掘为核心的数据探索阶段。在十多年前,计算方法被
以微博、社交网络等为代表的Web2.0互联网应用的兴起及其处理数据量的爆炸性增长,对数据管理的灵活性、可扩展性、高性能的读写有了更高的要求。传统的关系数据库由于模式固定
随着企业信息化建设进程的推进,越来越多的企业需要集成各种不同的信息管理系统。在对企业信息管理系统进行集成时,主要会面对系统间的异构性、完整性、语义冲突和集成内容的