论文部分内容阅读
盲源分离是在信号混合过程未知或所知很少的情况下仅根据观测信号对源信号进行有效估计的一种技术。语音信号的盲分离是盲源分离领域的一个难点与热点,在语音增强、语音识别、说话人定位、高性能助听器等领域有广泛的应用前景,目前有关语音信号盲分离的理论研究仍是主流,语音信号混叠模型主要有瞬时混叠与卷积混叠两种,由于真实环境中语音信号的多径传输与延迟性,因此更加符合真实环境的卷积混叠盲分离问题成为研究热点之一。解决卷积混叠语音信号盲分离的方法目前主要分为时域算法与频域算法等两大类算法。频域算法特点是计算复杂度相对较低、分离效果良好,虽然在频域算法中可以在频域中直接使用经典的瞬时混叠盲源分离算法,但也需要解决排序不确定性这一关键难题。卷积混叠模型由于模型本身的复杂性导致其计算复杂度远大于瞬时混叠模型,故当前大多数算法仍是在性能较高的计算机上完成仿真,嵌入式系统方案非常少,目前科技产品正朝着智能化、小型化方向发展,将语音信号盲分离算法移植到嵌入式平台上将是一项有意义的工作。针对上述问题,本文研究了针对真实环境下卷积混叠模型语音信号盲分离的方法与实现技术。提出一种卷积混叠模型语音信号的频域盲分离方法,其中针对频域算法中的排序不确定性问题提出了一种基于聚类思想的排序算法;设计并实现了一种基于DSP TMS320C6713语音信号盲分离系统;同时研究了在Windows操作系统环境下如何利用多媒体API设计语音信号盲分离系统。本文的主要贡献包括以下几点:(1)总结了语音信号盲分离当前的理论与应用研究现状,同时介绍了卷积混叠模型盲信号分离的基本原理,并分析比较了时域和频域两类方法的优缺点。(2)提出一种卷积混叠模型语音信号的频域盲分离方法,算法分为三步,首先将时域信号经短时傅里叶变换到频域,在频域上每个频点上使用复数值JADE算法,然后使用一种基于聚类思想的排序算法解决排序问题和使用基于最小失真原则的方法解决幅度问题,获得分离滤波器后,再对观测信号滤波得到分离信号。计算机仿真表明本算法具有良好的分离性能。(3)提出了一种真实环境中语音信号盲分离嵌入式系统的实现方案,对语音肓分离的嵌入式平台应用进行了初步探索。该系统以TI公司TMS320C6713DSP处理器作为硬件核心平台,基于TMS320C6713DSK并设计了系统前端双通道麦克风采集电路,在CCS3.1开发环境下完成了一种基于非平稳性的卷积混叠语音信号盲分离算法的移植,并进行了大量的软件优化。测试结果显示本系统运行稳定,并具有较好的分离性能,实现了离线和在线情况下对真实环境中两说话人混合语音信号的有效分离。(4)提出一种在Windows操作系统环境下的语音信号肓分离系统设计方案,外围硬件主要包括一个USB声卡和两个电容麦克风。系统在Visual C++6.0开发环境下使用C/C++进行开发,合理设计系统框架,核心功能主要包括语音采集线程、BSS算法处理线程、语音播放线程三个线程。利用MFC设计简洁、用户交互良好的界而,利用Windows多媒体API操纵音频数据流。测试结果显示在真实环:境下对两个说话人进行语音分离,本系统具有良好的分离性能及稳定性。