论文部分内容阅读
电子鼻,也即人工嗅觉系统或气味扫描仪,是模仿人类嗅觉机制,通过结合电子电路技术和传感器阵列,辅以模式识别方法进行数据分析的一套系统,能够实现对单一或混合气体的识别功能。本研究中使用的电子鼻是实验室自行设计搭建的一套以16个金属氧化物传感器为敏感元件的检测系统,相比于其他气体检测技术具有反应迅速、成本低廉、操作简单、通用性强等优点,可以方便地进行流程控制、参数调节及数据存储。本文选择不同头数的正品三七及其7种常见伪品作为实验研究对象,分类目标有二:一是探讨正品三七(取20头)与其7种伪品间的多分类效果;二是探讨不同头数的正品三七(20头、40头、60头)的分类效果。结合实验目标,在电子鼻检测平台的基础上,设计实验流程,完成样本气体制备,进行数据采集与存储,对响应信号进行基线校正、降噪滤波预处理。尝试了一整套基于特征工程的数据处理方法,包括特征生成、特征选择和模式识别。特征选择部分设计了 3种特征筛选策略,分别是基于递归特征消除的特征选择策略(RFE)、基于相关分析法的特征选择策略和基于XGBoost的模型特征选择策略,使用支持向量机SVM作为基础分类器比较降维效果。在bagging集成算法基础上,对加权投票规则进行了优化,充分利用基分类器的先验知识,根据对不同类别样本的识别准确率设置不同的权重值;对基分类器的差异性进行分析,找到最优基分类器组合,从而进一步提升分类的准确率。同样尝试自动特征提取的深度学习方法,采用了堆叠栈式自编码网络(SAE)和深度信念网络(DBNs)两种结构。对于每种结构分别设计两种方案:一是经过特征重构后直接输出到分类器,用于和传统手工提取特征对比,二是在深度网络结构中加入分类器,引入BPNN反向传播算法指导参数微调。既对比了手动和自动特征提取表现出的性能差异,也探究了深度学习方法在电子鼻数据上的适用性。实验结果表明,基于特征工程的分类算法和深度学习的方法都可以有效提升分类效果。在三七及其伪品的分类中,手动特征提取结合机器学习的方法获得了很好的分类效果,经过MSVM-RFE选择的特征集分类准确率达87.47%,经过优化后的集成算法准确率进一步被提升为91.57%,分类效果优于几种深度学习方法,找到一套行之有效的基于特征工程的分类算法流程运用于电子鼻数据上。而在不同头数的三七分类中,由于响应信号相似性较高,特征工程的分类方法最优73.68%,而DBNs+BPNN+Softmax的深度学习模型可使准确率达74.65%,深度学习的方法在复杂特征提取上表现出良好的性能。对于目前特征维度而言,样本数量较少,随着样本量的增加可以获得更优的识别效果。