【摘 要】
:
听觉作为人们感知环境的重要通道,在视线障碍、不利光照条件等情况中可作为视觉的重要补充。在监控领域,音频监听可以作为视频监控的重要补充。现有的音频监听方法应用在不同场景时需要根据不同场景提供大量有标签数据用于训练。如何自动构建不同场景的背景训练数据以达到场景自适应目的,节省人工标注成本,成为一个值得研究的问题。本文旨在研究一套能够适应不同声场景的音频监听系统方案。监听系统自动录制并构建当前场景的背景
论文部分内容阅读
听觉作为人们感知环境的重要通道,在视线障碍、不利光照条件等情况中可作为视觉的重要补充。在监控领域,音频监听可以作为视频监控的重要补充。现有的音频监听方法应用在不同场景时需要根据不同场景提供大量有标签数据用于训练。如何自动构建不同场景的背景训练数据以达到场景自适应目的,节省人工标注成本,成为一个值得研究的问题。本文旨在研究一套能够适应不同声场景的音频监听系统方案。监听系统自动录制并构建当前场景的背景训练数据,以区分监听场所的背景音与异常音。主要解决两个问题:一是如何自动计算不等长音频数据的聚类数并快速聚类,二是如何解决样本本身存在并由聚类加剧的训练数据分布不均衡且类间混杂、类内差异明显问题。本文的主要工作包括:(1)提出一种连续音频段分割方法提高音频段的纯净性。提出一种基于基频差值的连续音频段分割方法,通过基频差值描述音频段之间的差异,为后续的聚类和检测提高分割音频段的纯净性。(2)提出一种距离计算方法计算不等长音频段距离。提出N阶特征点概念,用于概括描述音频包络特征;提出了一种基于N阶特征点集快速对齐的动态时间规整距离计算方法,通过特征点集进行音频段对齐,分段计算动态时间规整距离。实验证明该方法有效降低了距离计算的时间复杂度,在两个长度约为10秒的样本距离计算中,快速对齐的动态时间归整计算方法比整段计算方法最多节省2.5秒的计算时间。(3)改进一种音频聚类方法提高聚类结果纯度。为了提高聚类纯度,提出连通距离概念,改进一种基于密度峰值的音频聚类方法。在密度峰值聚类过程中增加连通距离的样本属性,使得聚类纯度在二维数据集和音频数据集分别有约18%和30%的提升。(4)引入高斯混合模型-通用背景模型的分类方法。缓解背景数据分布不均衡导致的类间混杂、类内纯度不理想问题。通过大量实验对比分析找到分类模型的合理结构与参数,在二分类实验中,异常音频事件的精确率和召回率分别达到97%和83%。(5)设计并实现了自适应场景的异常音频事件监听系统。该系统具有音频事件获取、异常样本筛选、背景训练样本聚类方法、异常事件与背景事件模型训练与异常音频事件检测等功能。本文对该系统进行了两个场景的离线验证实验和一个真实场景的在线监听实验。在离线验证实验中,背景音频能量大且事件复杂的实验室场景,异常音频事件的精确率和召回率分别是65%和83%;在背景音频能量小的家庭场景,异常音频事件精确率和召回率分别是91%和88%。在实验室场景的在线监听实验中,精确率和召回率分别达到56%和79%。
其他文献
电子行业是个新产品快速迭代的行业,这决定了创新是该行业中各企业的求生之道。而创新离不开设计,设计离不开“设计文件的管理制度”。SJ/T 207标准(简称“SJ207”)就是我国
随着通信技术的发展,5G时代即将来临。作为5G技术中的关键技术之一,多用户多输入多输出系统(Multiuser Multiple Input Multiple Output,MU-MIMO)在提高系统吞吐量的同时还会
现代信息技术有着快、便捷、突破时空限制,直观动感,易激发兴趣等优势。本文在新型冠状疫情背景下思考如何将"停课不停学"的精神落实,如何利用现代信息技术手段的优势将科学
反射面天线由于波束覆盖范围广、增益高、结构简单等优点常用在卫星通信中。本文主要研究了基于反射面天线的波束赋形,包括反射面天线形面优化和反射面天线馈源阵列优化两种
蛋白质或者多肽在某些条件下可产生淀粉样变性形成纤维,沉积于机体组织,造成器官及其功能损害。蛋白质淀粉样沉积是很多人类疾病的重要特征之一,大约有20多种疾病与相关的蛋
大容量火电机组的协调系统具有强非线性、大延迟等特点,传统控制算法在机组大工况范围内运行时的控制效果不理想,需要以精确表征机组运行动态特性的模型为基础,设计先进的控制器。本文以某超超临界机组协调系统为研究对象,对系统建模以及控制仿真进行了研究,主要的研究成果包括以下几个方面:1.针对传统粒子群优化算法,对惯性权重、学习因子等参数变化策略进行改进,并引入界限划分及粒子变异的思想,提出一种界限划分变异粒
图像作为当今重要的载体承载了大量的信息,对其中的文字信息提取能推动对图像的理解。相比特定场景的文字信息提取问题,自然场景下文字定位的难度较大。同时由于文档、报纸和
目的子痫前期血清中胎盘缺氧滋养细胞来源的sFlt-1增加与尿蛋白的产生相关,但是,滋养细胞缺氧分泌sFlt-1导致尿蛋白的上下游分子调控机制不明。HIF1α/2 α是滋养细胞缺氧的主要应激因子,有研究发现,Flt-1为HIF1α/2 α的靶基因;本课题组前期研究发现,子痫前期血清可通过增加CAV1表达促进肾小球血管内皮细胞(humanrenal glomerular vascular endoth
在现代工业生产中,电机转子产量需求巨大。针对其换向器与漆包线缠绕形态合格性检测目前以人工为主,效率低且易受干扰的问题,本文致力于研究一种基于对抗神经网络和注意力机制的转子绕线在线合格性检测算法。主要的研究内容如下:(1)设计了一套针对转子绕线合格性在线检测流程。通过对待测部位形态学分析,结合控制系统与传动系统精确配准,对旋转件转子绕线图像进行挂钩模板定位分割,得到受偏转角影响较小的转子绕线部分,利
目的:探讨纤维蛋白Bβ15-42模拟肽和蚓激酶EFEa对纤维蛋白活化后巨噬细胞穿经内皮细胞的影响及对NF-KB/VE-cadherin途径可能的作用机制。方法:以人脐静脉内皮细胞系为基础,使用慢病毒对其感染,建立高表达VE-cadherin的人脐静脉内皮细胞系。使用高浓度纤维蛋白Fb(6mg/ml)、和同时加入Bβ15-42模拟肽(0.6 mg/ml)与EFEa(2μg/ml)处理细胞,通过蛋白免