【摘 要】
:
卷积神经网络模型作为音频特征提取器具有较好的应用效果,但该类模型的训练过程对数据量要求比较高。针对这一问题,本文提出一种基于双重数据增强策略的音频分类方法。首先采
【机 构】
:
武汉科技大学计算机科学与技术学院,武汉科技大学大数据科学与工程研究院,武汉科技大学智能信息处理与实时工业系统湖北省重点实验室
【基金项目】
:
国家自然科学基金资助项目(U1803262,61702381).
论文部分内容阅读
卷积神经网络模型作为音频特征提取器具有较好的应用效果,但该类模型的训练过程对数据量要求比较高。针对这一问题,本文提出一种基于双重数据增强策略的音频分类方法。首先采用传统音频数据增强方法(旋转、调音、变调、加噪),并将增强后的数据转化为语谱图,再采用随机均值替换法进行谱图增强。在此基础上训练Inception_Resnet_V2神经网络模型作为音频特征提取器,最后训练随机森林模型作为分类器完成音频分类任务。实验结果表明,与已有方法相比,采用双重数据增强策略可明显提升音频分类精度,并且训练出的特征提取模型具有
其他文献
随着城市化进程的加快和经济建设的快速发展,城市污水排放量迅速增加。各机构内部二级处理厂的分担处理作用是巨大的,如何维持其稳定运行是个重要的问题。通过跟进其他机构内
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
互联网作为一个新兴的媒介,逐渐成为网络游戏、电子商务等大展拳脚的平台。相比传统的媒介而言,它最突出的优势就是动画的展示。而HTML5开发的应用具有多设备、跨平台的优势,
方法要点加氢氧化钠于镀铬溶液中,三价铬、铁等金属离子生成氢氧化物沉淀过滤除去,氟硅酸生成氟离子留在溶液中。在滤液中加入氯化钙溶液,在pH=4~4.5氟定量生成氟化钙沉淀。
"异托邦"是福柯重要的空间批判和现代知识批判概念,可以说这个概念和与此相关的批判方式影响了福柯的一生。通过分析了"异托邦"的六个基本特征,福柯开启了他将空间哲学与政治权力
选言命题是指一种断定它的支命题至少一个为真并且它们在部分情况下虽然可以同真但又非必须同真的复合命题。在逻辑史上,选言命题最初仅指不相容选言命题,直至十三世纪后期才
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
乔治·奥威尔是二十世纪上半叶英国著名作家,他一生的创作涉及随笔、散文、小说等各领域。但其写作几乎都是与政治有关。在他创作生涯后期,转向政治寓言小说创作,其作品《动物农
景区公众号已成为景区重要的营销渠道和服务媒介.根据清博网和中青在线的数据,选取全国5A级旅游景区微信公众号影响力前50强的婺源风景区和海南海景乐园蜈支洲岛作为典范,对