论文部分内容阅读
随着智能交通系统的快速发展,基于车辆声信号的车型分类方法引起人们的广泛关注。车辆声信号是一种时变非平稳的随机信号,若是直接以声信号作为训练样本,那么需要训练的数据量将会十分庞大,对系统的计算和存储能力要求较高。为了适应需求,需对声信号进行特征提取,提取的特征参数应尽可能完全、准确地表达声信号携带的信息。不同的特征参数由于识别性能和抗噪性能的差异,直接影响着系统的鲁棒性。因此本文研究了声信号的分解方法以及深度学习模型,着重对基于ConvBiLSTM模型的车型分类方法进行研究。主要研究内容如下:
1)提出改进基于ICA的车辆声信号特征提取方法
针对MFCC计算过程中的离散余弦变换为纯粹的数学计算,经过DCT后得到的特征参数与实际信号无关,且DCT只能部分去相关,导致MFCC对带噪声信号表现较差的问题,本文提出改进基于ICA的车辆声信号特征提取方法。用基于负熵最大化的FastICA算法代替MFCC中的DCT,分解出车辆声信号的基函数和特征参数。由于ICA需要使用大量的样本信号对其模型进行训练,因此可以充分适应样本信号的特点,特征表达能力更强,从而提高系统的识别率和鲁棒性。
2)提出改进基于LSTM、1D-CNN的车型分类方法
将LSTM、CNN模型引入到智能交通领域的车型分类中来,根据本文车辆声信号的特点及实际分类需求,构造并优化相关网络结构及超参数,实现基于LSTM、BiLSTM以及1D-CNN的车型分类。实验表明:针对本文提出改进的ICA特征提取方法制作的数据集,当迭代200次时,LSTM、BiLSTM以及1D-CNN在测试集上的车型分类准确率分别为90.9%、92.5%、93.1%,较MFCC方法至少提高了4%。
3)提出改进基于ConvBiLSTM模型的车型分类方法
针对FC-LSTM未考虑特征的空间相关性,无法提取空间特征的问题,本文将ConvLSTM模型引入到基于车辆声信号的车型分类中。ConvLSTM既结合了CNN提取空间特征能力的优点,又兼顾了LSTM可以访问时序信号先验知识的特性。在对ConvLSTM模型进行理论研究的基础上,根据本文车辆声信号的特点,将其改进为ConvBiLSTM模型。该模型将ConvLSTM分别从正向和反向依次扫描数据提取特征,然后将提取的特征进行堆叠,从而保证特征提取的有效性。实验表明:ConvBiLSTM模型性能最优,在分类准确率方面ConvBiLSTM>1D-CNN>BiLSTM;在收敛速度方面ConvBiLSTM>BiLSTM>1D-CNN。
1)提出改进基于ICA的车辆声信号特征提取方法
针对MFCC计算过程中的离散余弦变换为纯粹的数学计算,经过DCT后得到的特征参数与实际信号无关,且DCT只能部分去相关,导致MFCC对带噪声信号表现较差的问题,本文提出改进基于ICA的车辆声信号特征提取方法。用基于负熵最大化的FastICA算法代替MFCC中的DCT,分解出车辆声信号的基函数和特征参数。由于ICA需要使用大量的样本信号对其模型进行训练,因此可以充分适应样本信号的特点,特征表达能力更强,从而提高系统的识别率和鲁棒性。
2)提出改进基于LSTM、1D-CNN的车型分类方法
将LSTM、CNN模型引入到智能交通领域的车型分类中来,根据本文车辆声信号的特点及实际分类需求,构造并优化相关网络结构及超参数,实现基于LSTM、BiLSTM以及1D-CNN的车型分类。实验表明:针对本文提出改进的ICA特征提取方法制作的数据集,当迭代200次时,LSTM、BiLSTM以及1D-CNN在测试集上的车型分类准确率分别为90.9%、92.5%、93.1%,较MFCC方法至少提高了4%。
3)提出改进基于ConvBiLSTM模型的车型分类方法
针对FC-LSTM未考虑特征的空间相关性,无法提取空间特征的问题,本文将ConvLSTM模型引入到基于车辆声信号的车型分类中。ConvLSTM既结合了CNN提取空间特征能力的优点,又兼顾了LSTM可以访问时序信号先验知识的特性。在对ConvLSTM模型进行理论研究的基础上,根据本文车辆声信号的特点,将其改进为ConvBiLSTM模型。该模型将ConvLSTM分别从正向和反向依次扫描数据提取特征,然后将提取的特征进行堆叠,从而保证特征提取的有效性。实验表明:ConvBiLSTM模型性能最优,在分类准确率方面ConvBiLSTM>1D-CNN>BiLSTM;在收敛速度方面ConvBiLSTM>BiLSTM>1D-CNN。