语音增强算法研究及信号分析平台的研发

来源 :山东大学 | 被引量 : 0次 | 上传用户:sm3618
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号作为信息的最普遍最直接的表达方式,在许多领域具有广泛的应用前景。然而在实际语音通信过程中,不可避免地会受到来自周围环境、传输媒介引入的噪声、通信设备内部电噪声、乃至其它讲话者的干扰。所有这些因素会造成接收到的语音信号并非纯净的原始语音信号,而是受噪声污染的带噪语音信号。为了从带噪语音信号中获得尽可能纯净的语音信号,减少噪音的干扰,就需进行语音增强。 在一般情况下干扰信号是随机信号,要完全排除噪音是不现实的,所以语音增强的目标对收听人而言主要是改善语音质量,提高语音可懂度,减少疲劳感;对语音处理系统(识别器、声码器、手机)而言是提高了系统的识别率和抗干扰能力。 本课题首先较全面总结了目前常用语音增强方法的分类和特点,然后对近几年新提出的多窗谱法进行了详细研究,分析了多窗谱法在语音增强中的应用原理、小波函数的选取等若干问题,并针对硬阈值、软闽值法的不足,采用了一种改进的小波阈值函数。同时,为了方便对语音信号的分析和应用开发,论文给出了我们自己研发的语音信号分析平台。针对开发过程中遇到的实际问题,提出相应的解决方法,其中包括多线程、波形曲线缩放等技术,并搭建了分析平台的整体架构和实现部分常用功能,为平台功能的进一步扩展奠定基础。 研究过程中,将传统的谱减法、STSA-MMSE法在语音增强中的效果与多窗谱法进行了实验对比。研究结果表明,多窗谱法的增强效果比其他两种方法更好。基于无语音帧带噪语音功率谱与噪声的功率谱相同的假设,噪声估计算法可通过跟踪无语音帧来更新噪声谱估计。该方法将带噪语音在频域上划分为三个频带,低频段:0-1kHz,中频段:1-3kHz,高频段:3kHz以上,并在三个频段上分别计算本频段与前一噪声估计中对应频段带噪语音的能量之比;再将能量比值与实验确定的阈值进行比较,根据比较结果确定出该帧是否为语音帧,从而采用不同的更新算法。 对环境变化较快的语音增强方法也进行了深入研究。实验中,采用改进的小
其他文献
人脸识别技术是公认的生物识别技术里最友善、最不具备侵犯性的识别技术。从1888年第一个正式的人脸识别方法提出至今,国内外的许多学者、科研机构都在从事人脸识别系统的研究
随着数字图像信息资源的快速增长,如何从海量的图像数据库中快速准确地找到用户需要的图像信息已成为一个有待解决的问题。传统的基于文本的图像检索技术已不能满足用户的需
功率控制是无线资源管理中的重要模块,也是CDMA系统的关键技术之一。有效的功率控制策略可以很好的消除“远近效应”和“边缘效应”,减小系统内干扰,提高系统容量。本文针对
MPLS(Multiprotocol Label Switching,多协议标记交换)是一种在开放的通信网上利用标记引导数据实现高效转发的新兴隧道技术,它实现了在面向连接的交换网络上提供非连接的数据
目标机动性和环境复杂性大幅增加了数据关联的难度。针对传统目标关联方法过度依赖先验信息,对监视区域内大规模、运动模型各异的目标关联效果较差的问题,本文主要研究基于点
物体的热胀冷缩是极为普遍而又非常重要的物理现象,特别是对于金属的热胀冷缩规律的研究,在机械制造、精密仪器的设计以及工程建筑等各个领域都十分重要。因此金属线膨胀系数的
蜜罐就是一个虚拟的系统或网络,专门用于诱骗黑客;发现,保存和分析计算机系统上黑客留下的蛛丝马迹,并随时跟踪他们的行踪,借而了解黑客使用的最新技术和工作思路。通过获取这些技
国内互联网接入市场已经历了连续数年的高速增长,保持着较高的增长率,将逐步进入稳定发展期。与之相应的,业务收入的ARPU值也在逐年下降。如何保持互联网业务发展的活力,巩固固网
近年来,软件无线电技术倍受关注,被认为是未来通信乃至未来无线电技术的发展方向。它突破了传统无线电台以功能单一、可扩展性差的硬件为设计核心的局限性,强调了要使通信系统摆
随着信息化技术和市场经济的快速发展,传统的机构单靠自身内部资源与优势已很难适应市场的快速变化,虚拟合作联盟以其自身的优势,成为了当今社会日趋重要的合作组织模式。虚拟合