【摘 要】
:
音频场景分类作为声学场景理解的关键环节,对机器感知复杂环境并做出智能选择有着非常重要的意义。针对音频场景分类性能提升这一问题,提出改进的基于卷积神经网络模型的音频
【基金项目】
:
国家自然科学基金项目(61640012),内蒙古自然科学基金项目(2017MS(LH)0602)
论文部分内容阅读
音频场景分类作为声学场景理解的关键环节,对机器感知复杂环境并做出智能选择有着非常重要的意义。针对音频场景分类性能提升这一问题,提出改进的基于卷积神经网络模型的音频场景分类方法。首先对音频数据重新采样,预处理后得到对数梅尔谱图,随后输入到改进的卷积神经网络模型,进行卷积和池化处理提取谱图的特征,由Softmax分类器对音频场景标签进行分类。实验最后在城市音频数据集上进行十折交叉验证,实验结果表明,所提模型比传统的卷积神经网络模型的分类准确率更高,准确率达到了80%。
其他文献
随着油页岩水平距离的变化,传统模型模拟的油页岩热量差值变化幅度较大。针对这一问题,基于Matlab和Monte Carlo方法设计一种新的油页岩非均质热弹塑性损伤模型。在分析Matla
转变传统观念,提高读者工作人员的服务素质,是深化读者工作的前提条件,只有改进服务方式,挖掘图书馆潜力,开发文献资源,深化读者工作,才能全面提高服务水平.
在天体运动中,将两颗彼此相距较近,在相互之间万有引力的作用下,绕两者连线上的某点做周期相同的匀速圆周运动的行星称为双星。双星问题是天体运动中一个重要模型,对双星系统
测量电源电动势和内阻是高中学生物理课程开展的一个实验,有两种测量电源电动势和内阻的方法:解方程组法和图像法。本文就这两种方法进行讨论分析,并提出一种新的实验方法,以减少
传统的音乐欣赏课教学有其特点,但是随着多媒体技术的发展,多媒体教学的形象性、直观性等特点日渐显现,《音乐欣赏》课程自身的要求及学生学习的特点,使得将多媒体运用于音乐
本系创建于1987年。87年秋季开始招生,为3年制师范专科学校英语专业,现有三个年级,学生总数119人;毕业生已达6届,总计204人,其中6人“专升本”,计每届1人;在校生93级40人,94
随着科学技术的迅速发展,特别是由于以计算机技术为中心的各项新技术科学、新理论和交叉学科的形成与发展,使人类社会开始进入到一个信息爆炸的全新时代。在众多信息中,图书
2020年11月27日,苏州安特威阀门有限公司“聚烯烃工艺高频程控球阀”科技成果鉴定会顺利召开,经鉴定委员会审查、讨论,一致认为:该科技成果达到了国际同类产品的先进水平,建
在战争背景下,女性常被纳入到国家、民族、革命的视域,被当作国家、民族、革命的表征与符码,身体通常成为女性介入战争的武器与工具。《炸弹与征鸟》《冲出云围的月亮》《色&