基于计算听觉场景分析的单通道语音分离研究

被引量 : 8次 | 上传用户：zhangyuxin_718

【摘要】

：

单通道语音分离系统能够在单一信道内将目标语音从嘈杂的背景干扰中提取并分离出来,常作为语音识别与说话人识别的前端模块。而基于计算听觉场景分析(Computational Auditory

【作者】

：

王雨

【发表日期】

：

2013年01期

【关键词】

：

计算听觉场景分析语音分离能量提取基音跟踪清音分离掩码平滑

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

单通道语音分离系统能够在单一信道内将目标语音从嘈杂的背景干扰中提取并分离出来,常作为语音识别与说话人识别的前端模块。而基于计算听觉场景分析(Computational Auditory Scene Analysis,简称CASA)的语音分离系统能够通过计算机模拟人耳对目标语音的感知和跟踪现象,完成单通道语音分离的任务。由于其语音分离过程更接近于人耳对混合语音的感知分离过程,因此近年来该课题逐渐成为语音分离领域的研究热点。本文对计算听觉场景分析课题进行深入研究,详细介绍了基于CASA原理的单通道语音分离系统的结构和发展背景,并且在传统CASA系统的基础上提出了一套改进的语音分离系统。本文主要创新点如下：(1)基于改进阂值的有效能量特征提取。在对自然语音的浊音信号进行提取分离时,能量是重要的信号特征。传统CASA系统在计算有效能量特征时采取同一阂值,但由于噪音信号的不确定性与多样化,当混合语音中所含的噪音数据分布规律未知时,背景噪声对各频率信道有效能量特征的干扰将具有差异性,而传统恒定阈值无法有效地剔除干扰噪声单元。因此,本文采取基于平均信道能量的改进阂值方法对每个信道的时频域响应能量进行提取,提高了有效能量特征提取的精确性。(2)基于目标源单元的迭代基音估计算法。传统基音估计算法在进行基音估计时没有剔除干扰源单元,而是直接基于信道中的所有单元的自相关响应进行基音频率计算,导致基音计算结果具有一定的误差。本文提出的改进基音算法仅针对于已标记的目标源单元进行基音计算,首先将标记为干扰源的单元剔除,仅从估计的目标源单元中提取基音,之后再根据估计的基音轨迹进行新一轮的目标源单元标记。该算法对目标源单元标记和基音估计两个步骤进行迭代计算,直到每个浊音段的各帧基频达到稳定为止。实验证明,该算法能够提高基音估计的鲁棒性,改进了含噪环境下的传统基音提取算法。(3)基于谱减的改进清音分离方法。在提取了具有基音周期特征的浊音信号之后,需要将清音信号从残余干扰噪声中进一步提取出来。根据噪声信号分布的不确定性和不稳定性,本文提出了基于谱减的改进清音分离方法,通过距离加权的残余噪声估计算法得到每个清音单元中所包含的噪声能量,之后对每个清音单元进行谱减算法并标记,剔除残余噪声单元,提取出清音信号。该方法对具有时变性的残余噪声估计结果更加精确,能够提高清音分离的有效性。(4)基于形态学图像处理的掩码平滑。聚类后的二值掩码图被用于最终的语音重构。由于含噪情况下基音提取与目标源标记存在着不可避免的误差,导致二值掩码图中经常包含零星的残余噪声点与破损的语音段,这将会大大影响重构语音的质量与可懂度。为了降低和消除该问题对重构语音造成的影响,本文提出了基于形态学图像后处理的掩码平滑方法,该方法对聚类后的二值掩码图进行平滑处理,通过膨胀,腐蚀等形态学图像处理算法的有效结合处理,能够在不破坏图像细节信息的情况下对二值掩码图进行有效地去噪修补,从而进一步提高了分离语音的质量。

其他文献

矿用压力传感器的动态特性研究

基于对液压支架压力传感器压力特性的分析,建立了传感器入口压力与出口压力间的数学模型。考虑压力传感器阻尼孔结构尺寸,采用数值方法与非线性回归分析,对压力传感器的动态

期刊

压力传感器阻尼孔动态特性非线性回归

袁庆禄

<正>袁庆禄1953年出生于中国河北曲周,曾为军旅画家。1988年就读于中央美术学院版画系。现任河北邯郸学院教授。系中国美术家协会会员、中国版画家协会理事、河北省版画家协

期刊

美术展览版画家中国版画家协会群星奖中国美术家协会河北省

以智能制造作为新经济主攻方向

当前，我国面临经济结构转型升级的艰巨任务，同时也赶上了新一轮科技和产业革命驱动的新经济蓬勃发展的历史机遇。如果说发达国家发展新经济的本质是信息化与“再工业化”的深度

期刊

智能制造深度融合主攻方向工业互联网

我国家电供应链成本管理研究

家电工业在国民经济中一直都占有重要的地位，它是人们日常生活中的必需品。近些年来，随着企业间竞争的加剧及家电总体产能过剩，家电供应链上的节点企业已全面进入微利时代。全球

学位

家电供应链成本管理成本核算成本控制

《太阳能集热管专利商业计划书》翻译实践报告

虽然目前我国科技研发人员总量达200万人以上，专利申请受理总数突破500万件，增长的速度均居世界榜首，但我国拥有的专利技术转化率却不足1%，吸引国外的投融资存在很大的困难，其原因

学位

商业计划书译前分析案例分析职业素质

甲硝唑联合外洗药治疗细菌性阴道炎的临床价值分析

目的研究治疗细菌性阴道炎应用甲硝唑联合外洗药的临床效果。方法选120例诊断出细菌性阴道炎的女性患者为研究对象,平均分成两组每组60例。对照组患者使用甲硝唑治疗,联合组

期刊

细菌性阴道炎外洗药甲硝唑

广州市大学生钙营养知识、态度、行为的调查

[目的]了解广州市大学生钙营养知识、态度、行为现况及影响因素,为开展营养健康教育,改善大学生的钙营养状况提供依据。[方法]采用K-A-P问卷方式对广州市两所高校561名大学生

期刊

大学生钙营养调查

民主的中国特色

作为中国的根本政治制度,人民代表大会制度的理论来源既有经典马克思主义的民主思想,也有中国共产党人在民主革命与社会主义建设过程中对民主理论的探索与思考：坚持政党政治、

学位

民主效能人民代表大会制度中国共产党

四川南部地区苗族情歌音乐特征探究

四川南部地区苗族音乐特别是声乐形式有着很深的文化底蕴，四川苗族同胞“赶苗场”盛会是远近闻名的，赶苗场中男女对唱情歌是极为重要的组成部分，苗族情歌不仅歌词非常讲究押韵，唱

期刊

情歌歌词情歌结构情歌声腔和声语言

艾塞那肽联合甘精胰岛素对肥胖2型糖尿病的临床观察

目的评价短期艾塞那肽联合甘精胰岛素在肥胖2型糖尿病（T2DM）的患者中应用的有效性及安全性。方法选择30例新诊断的肥胖2型糖尿病患者为研究对象，入选患者于早晚餐前60min皮下注

学位

2型糖尿病艾塞那肽甘精胰岛素肥胖

基于计算听觉场景分析的单通道语音分离研究

其他学术论文