复杂背景下的声音信号识别技术研究

来源 :沈阳理工大学 | 被引量 : 7次 | 上传用户:wanganInsh888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会的迅速发展带来大量的数据信息,而如何找出有用的信息就显得尤为重要,而且对于声音数据来说,若是可以有效地采集、处理、识别这些数据,就会变得更有价值。本文所研究的是复杂背景下的声音信号识别系统,并对系统进行深入分析和论证,重点开展了特征提取方法和识别技术研究,为实现复杂背景下精确的声音信号识别系统提供理论依据。本文主要对3种类型的声音信号做研究,包括法拉利汽车喇叭声、兰博基尼汽车喇叭声和野马汽车喇叭声。本文通过数据采集平台,利用GRAS麦克风采集汽车喇叭声,经过NI—9234数据采集卡和LabVIEW中NI--DAQmx技术中的子VI模块,将声音信号以波形的方式显示,并保存为.wav格式,再将数据传送到计算机中。本文重点研究复杂背景下的声音信号特征提取方法和识别技术,并通过MATLAB软件GUI用户界面开发程序设计了声音信号识别软件系统,具体内容如下:首先,对独立的声音信号进行端点检测和特征提取。在时间域上进行端点检测,根据研究对象的特点,提出来一种双域特征提取法来对信号进行特征提取。其次,对采集到的一段混有待测信号的声音段进行预处理,即降噪和盲源分离。采用5阶巴特沃斯低通滤波器对待测信号进行降噪处理,再采用独立分量分析(ICA)算法对声音信号进行分离。然后,针对声音识别中传统的BP神经网络识别算法在收敛速度等方面不尽理想的问题,提出了一种增加动量项和自适应算子的改进方法。最后,从实用性和整体性两方面着手,开发并设计出了复杂背景下的声音信号识别软件系统。对于复杂背景下的声音信号识别系统研究,本文结合研究对象的特点,找到一种适于本文研究对象的特征提取算法--双域特征提取法,即在时、频域内同时进行分析,建立完善的特征参数值,改进了前人特征提取方法的局限性,仿真证明本文所采用的方法可以更有效的提取出信号的特征值且效果更佳。本文的识别算法是对传统算法的改进优化,通过更新网络的权值公式,并与传统算法进行比较,发现改进的算法中网络的收敛速率降低了,系统的识别率得到提高。
其他文献
在制药、造纸、石油、化工等流程工业中,越来越多的应用了以模型预测控制(Model Predictive Control, MPC)勺代表的先进控制技术,使企业生产的安全性与控制系统的稳定性都得
基于单频输出感应加热电源在冶金、金属热处理等行业中有着广泛的应用,对国民经济发展有很大的推动作用。但是在加工复杂的工件,例如:轧辊和齿轮的时候,由于集肤效应的影响,
共轴双旋翼飞行器因其结构紧凑、悬停效率高、操纵性好等特点,被广泛应用到军事和民用上。为了使其可以在相对狭小的空间内达到理想的飞行效果并且具有良好的机动性能,对共轴双
连铸二冷控制是钢水连铸过程中的重要环节,直接决定着坯壳的表面温度、钢液的结晶方式和铸坯的质量。连铸过程具有结构复杂、强耦合性、反应机理复杂等特点,其生产条件相对恶
视频图像序列中的运动目标跟踪一直是计算机领域中的热点问题,在动态场景中运动目标的检测和跟踪技术通常可以利用在视频监控、人机交互、汽车辅助驾驶、运动行为分析等方面
学位
学位
随着信息技术的发展,图像配准技术已成为非常热门的研究课题,在许多领域有着广泛的应用。图像配准研究的主要目标是改善图像之间匹配的精度和速度,尤其是配准精度。图像的精确配
近年来,半导体晶体直径朝着大型化的方向发展,晶体的直径逐渐从6英寸发展到12英寸。晶体直径的大型化发展成为当前的主流趋势。生长出质量好、尺寸大的单晶硅需要非常稳定的
随着语义Web上发布的RDF数据量爆炸式的增长,具有海量规模和无标度特性的RDF图数据的划分,成为分布式RDF数据管理的重要问题。根据术语集和断言集结构对RDF数据整体特性的影