论文部分内容阅读
在音频事件检测任务中,目标音频易受背景噪声等因素的干扰,并且其在音频信号流中存在的比例不高,针对这些问题,提出一种多层次注意力机制一维DenseNet(dense convolutional network)音频事件检测模型。使用一维DenseNet模型进行帧级检测能有效地检测音频事件发生的开始和结束时间;在一维DenseNet模型中引入多层次注意力机制,使得不同模块的感知特性随着网络层数的加深而自适应地变化,因此模型可以在不同的网络层次自动选择和关注重要的目标帧而抑制不相关的背景帧。在DCASE