论文部分内容阅读
随着社会的发展,人们在解决自身温饱问题即将奔小康的同时,安全问题也越来越受到人们的关注。监控系统也应运而生,智能音视频分析可以有效的帮助我们发现环境中需要人注意的显著事件或者危害人身财产和安全的事件,也是监控系统的重要组成部分。目前大多数监控系统的注重视频信息的获取和处理,音频信息的处理相对比较少,但视频处理需要大量的存储空间,受光照和遮挡影响较大,而音频信号采集设备简单,存储量小,而且能更好地保护人们隐私等视频处理所不具备的优点,并且不同的声音信号可以包含不同的含义,有助于在监控系统中分析人们的行为和环境中发生的事件。因此,本文针对室内真实噪声环境下经常发生的声音事件的检测和识别开展了以下工作: 1.由于目前针对声音事件的研究的数据库相对缺乏,借鉴国内外声音事件的研究成果,收集和建立室内环境下声音事件数据库,其中包括十种日常需要引起人们注意的声音事件。 2.研究了真实噪声环境下声音事件的在线检测的方法。提取背景噪声的梅尔倒谱系数特征,建立了背景噪声的混合高斯模型,研究了自适应的背景噪声模型产生方法,根据环境的改变实时更新背景模型,对短时时间窗内的信号与背景模型进行匹配,设定合理的判定机制,判定当前时间窗内信号是否为声音事件。 3.针对低信噪比下声音识别率低的问题,利用自适应的背景高斯混合模型,对训练好的干净声音事件模板进行模型补偿,利用改进并行模型组合方法得到带噪声的声音事件模板,提高了识别系统对噪声的鲁棒性。 4.建立了网络化的声音事件在线监控系统,将本文提出的算法实用化,利用网络摄像头内置的麦克风录制数据,并利用网络传送数据,在线声音的检测和识别,将结果发送给系统前端界面显示并报警,给用户以提示。 本文通过大量实验,验证了自适应背景模型算法以及并行模型组合算法的有效性,可以比较有效的检测和识别室内环境中的声音事件。