基于模块化的语音信号预处理实现

被引量 : 0次 | 上传用户:ning0001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代信息技术中,语音信号处理技术发挥着越来越重要的作用。而语音信号预处理是语音信号处理中不可或缺的环节,它能够提高语音信号处理的效果。本文详细阐述了语音信号预处理技术中的几项关键技术,包括:放大和自动电平控制、自适应噪音抑制、高电平补偿、howling抑制等。自动电平控制(Automatic Level Control,ALC)技术是为了改善语音信号剧烈波动而提出的一种跟踪调整语音信号电平至最优值的方法。该方法用于终端。它的具体实现分为两部分:第一部分是基于两级动态的VAD检测,第二部分是RMS自动增益控制。自适应噪声抑制是指从带噪语音信号中提取尽可能纯净的原始语音。本文在经典的谱减法的基础上作了改进,利用人耳的掩蔽效应减小“音乐噪音”,实现了改进的最小控制谱减法。本文利用人耳的听觉特性,提出了一种基于等响度曲线函数的高电平补偿方法。该方法首先通过语音激活检测(VAD)技术判断出语音帧,然后通过等响度曲线[1]与语音信号的声压级求得电平补偿参数,并对语音帧的高频和低频进行相应的补偿,以得到主观听觉上的等响效果。本文通过分析howling的形成条件,提出了一种破坏这种条件的随机相位howling抑制方法。该方法先用polyphaseⅡR滤波器将语音信号划分为子带信号,再利用LMS自适应陷波滤波器检测对各个子带信号是否有howling的存在,判断出howling之后便利用随机相位系统对其进行抑制。以上各个语音预处理功能模块既具有独立的处理功能,又可以串联到一起以达到一个完整的功能。这样可以有针对性地对具有不同问题的语音信号调用不同的模块,实现不同的效果。
其他文献
二硫化碳(Carbon disulfide,CS2)是一种应用广泛的有机溶剂,为全身性毒物,可累及人体多系统多器官,神经系统是二硫化碳作用的主要靶器官,其毒作用机制尚不完全清楚。大量流行病
采用正电子湮没技术研究了13种金属离子掺杂对纳米TiO2光催化材料缺陷的影响,并讨论了离子掺杂对TiO2光催化材料平均电子密度和光催化活性的影响。结果表明,纳米TiO2光催化材
我国企业社会责任现状不容乐观,很多企业履行社会责任是被动的、不情愿的、迫于外部压力的,对企业自身的发展益处不大,是一种"单赢"模式。对此,我国企业很有必要将企业社会责
人体内存在着10万种以上的蛋白质,在机体中承担着不同的任务,来源于组织细胞,对维持人体机能变化起着重要的作用,当疾病状态时又起着重要病理意义的那些特殊蛋白,统称为特定
《全纳教师概述》揭示了全纳教育背景下教与学的四大核心价值观,八项全纳教师能力领域,由态度、知识和技能构成的三大能力领域要素,以及能力领域要素下的若干具体能力要求。
零售业工作流程优化的重点在于应用信息化流程管理系统对流程进行诊断、修复和改良,其中的关键在于制定和落实优化方案。零售业呼唤工作流程优化,应明确指导思想、适用范围、
以甲酸、过氧化氢和脂肪酸甲酯为原料,通过改变工艺条件合成环氧脂肪酸甲酯。考察过氧化氢浓度、甲酸用量、反应温度、反应时间、过氧化氢滴加时间以及过氧化氢用量对环氧化
知识产权与经济增长之间的关系已成为经济领域研究的热点。本文从定量的角度来分析,构建合理的指标体系、加权方法测算出我国知识产权的保护强度;建立合适计量模型,量化了知
当前,随着计算机技术的发展进步,以及社会整体经济水平的提升,人们的生活已经迈入到了一个以数字技术为标志的全新时代。在日常娱乐中,人们已经不再满足于传统的听广播、看电
对资源的掠夺式开发模式恶化了资源型城市自身的生态足迹,制约城市的健康发展,在此背景下,可持续发展战略必然成为资源型城市发展的首选战略。考虑到资源型产业发展所呈现出