论文部分内容阅读
当今针对公共场所的暴力恐怖事件时有发生,加强公共场所安全防护,依法打击犯罪,有效震慑犯罪分子,保障人们在公共场所的日常活动安全成为了各国政府关心的问题。公共场所中因其人员繁杂和流量巨大等特点给传统的视频监控系统带来了巨大挑战,配备专职监控人员在大量监控摄像机之间进行画面切换和观察,已经很难满足监控的实时性要求。因此提高现有视频监控系统的智能化水平,对提高监控效率具有非常重要的意义。针对现有视频监控系统中忽视对公共场所音频处理的不足,本研究着眼于伴随暴力恐怖事件发生的哭声、尖叫声、枪声和爆炸声等异常声音,通过在公共场所中部署的无线传感器节点实现异常声音采样,在详细分析了异常声音的时频域特征之后,使用SVM分类器实现声音识别,在此基础上提出了一种改进的最小二乘定位算法,实现声音的定位,最终为视频监控系统提供听觉定位辅助信息,便于其对异常情况发生地点的拍摄,提高监控过程中的针对性。论文的主要工作如下: (1)总结了现有的声源识别和定位技术,包括技术原理和优缺点分析。详细讨论了对异常声音的预处理技术,包括降采样、加窗分帧、预加重、端点检测和小波去噪,并给出了相应的实验结果与分析。 (2)收集大量异常声音样本建立数据库,并深入分析了异常声音的时频域特性,引入线性相关系数作为评价函数,利用过滤式特征选择方法实现异常声音的特征选择,在此基础上引入SVM分类算法,实现了异常声音分类。 (3)针对现有的基于能量的最大似然估计定位算法和非线性最小二乘声源定位算法存在的不足,给出了一种基于加权质心的非线性最小二乘定位算法,该算法使用优化的质心加权算法定位结果作为初步定位结果,在此基础上优化非线性最小二乘法的搜索空间,有效防止算法陷入局部最优,减少计算量的同时提升定位精度。并对其进行了仿真实验,给出了相应的实验结果和分析。