论文部分内容阅读
戏曲拥有着悠久的历史,蕴含着中国传统文化的精髓。然而近年来传统戏曲面临着严峻的发展问题,不少地方戏曲濒临灭绝。利用计算机技术对戏曲的自动化分类算法进行研究有利于戏曲的管理和保护。近年来,基于深度学习的音乐分类方法取得重大进展。目前戏曲分类的研究尚比较少,可以借鉴基于深度学习的音乐分类方法对戏曲进行分类,但仍存在特征提取没有考虑戏曲乐律、建模没有考虑戏曲片段间上下文依赖、模型参数庞大等问题。本文针对这些问题,提出基于深度学习的戏曲分类算法,其主要研究内容和创新点如下:(1)在特征提取方面,本文提出了一种基于变Q变换和滤波器组技术的时频特征提取方法。本文首先通过收集八个戏曲剧种的戏曲曲目,构建一个高质量的戏曲数据集。然后利用变Q变换对戏曲信号进行时频变换,通过基于戏曲乐律设计的滤波器组,获取戏曲片段信号在音阶频率上的能量分布,进而提取时频特征。实验表明,该方法不仅可以克服主流方法在低频段时间分辨率不足的问题,同时也考虑了戏曲的五声音阶以及腔音因素的影响,更加符合戏曲乐律。(2)在模型设计方面,本文提出了一种基于多层级联神经网络的戏曲分类方法。其中,多层级联神经网络由两级模型组成:一级模型由一维残差主干网络以及多尺度特征提取器组成,主要针对戏曲片段内部的时频特性进行建模;二级模型由双向循环神经网络构成,主要针对戏曲内各个片段之间的上下文依赖关系进行建模,同时引入注意力机制,学习各个片段间的重要性。此方法同时考虑了片段内部及片段间的上下文依赖关系。实验表明,该方法在戏曲数据集上总体准确率达到96.5%,超过基于卷积神经网络和多数投票的分类算法以及基于传统机器学习的分类算法。(3)在模型优化方面,本文提出了一种更加轻量化及并行化的多层级联神经网络,并部署到嵌入式端。通过深度可分离卷积和Transformer结构分别对多层级联神经网络的一级模型和二级模型实现轻量化和并行化的优化,弥补多层级联神经网络参数较大的不足,进一步提升计算效率。实验表明,该方法在保证模型精度的前提下,减少了模型的参数量,加快了计算速度,并在嵌入式端上实现戏曲分类。优化后的模型部署到嵌入式端Nvidia Jetson?TX1平台上,并在该平台上实现嵌入式端戏曲分类系统。