基于计算声场景分析的混叠语音分离研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:haiyunnihao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声场景分析主要研究如何在嘈杂的声音中感知环境事件。当各种声源同时存在时,人们将来自不同声源的声音信号区分开被称之声源分离问题,这是计算声场景分析的基础技术。 本文描述了一种能够有效分离混叠语音信号的系统。我们知道影响声源分离的因素有多种,想要实现混叠语音分离,必须知道人类听觉系统是如何从复杂的混叠语音流中得到属于各个源信号的信息的。 本文的主要工作可分为如下三个方面: 1、建立一个能反映人类听觉心理特征的新的听觉模型,混叠语音信号经过该模型后转换成为一系列频率分量。 2、将变换后的信息转换成可以按照不同声源分组的感观要素。在此基础上,对上述过程所得到的感观要素按不同声源加以分组。 3、最后,利用来自同一声源的感观要素重新合成或重建感兴趣的语音源信号。 经实验证明本文所提出的混叠语音分离方法是有效的。
其他文献
随着TD-SCDMA通信系统在中国的大规模商用,TDD技术已经得到前所未有的重视,TDD技术的种种优势也得到了充分挖掘。在3G时代,TDD技术还只是作为一种备用方案的话,那么到了4G时代,TDD
Ad hoc网络是一种有特殊用途的对等式网络,具有无中心、自组织、可快速展开、可移动等特点,这些特点使得它在战场、救灾等特殊场合的应用日渐受到人们的重视。Ad hoc网络使用无
对于将来的移动通信系统,直接序列扩频码分多址(DS-CDMA)是一种很流行的多址技术。多址干扰和多径衰落是影响DS-CDMA系统容量最主要的因素,目前已经有很多先进的技术用来对抗多
该文主要研究了在基于OFDM的IEEE802.11a 协议中空时编码技术的应用.首先简要地介绍了空时编码技术的信息论基础MIMO信道容量,以及几种主要的空时码,包括空时分组码和空时格状编
该文主要研究无线视频通信中的差错控制方案.文中视频通信的框架基于3G-324/M建议,文中构架了基于ITU-T无线多媒体终端标准H.324/M的无线视频通讯仿真平台,通过此平台可研究